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语料库 翻译 学 文库 
总 OF 


语料库 翻译 学 , 即 基于 语料库 的 翻译 研究 ; 它 在 研究 方法 上 以 语言 学 理论 为 指 
导 , 以 概率 和 统计 为 手段 ,以 双语 真实 语 料 为 对 象 ,对 翻译 进行 历时 或 共 时 的 研究 ， 
代表 一 种 新 的 研究 范式 。 语 料 库 翻 译 学 一 般 依靠 双语 语料库 ,主要 是 翻译 语料库 
(translational corpus) ,平行 /对 应 语料库 (parallel corpus) 和 类 比 语料库 (comparable 
corpora) ,并 需 分 别 进行 不 同 的 标注 。 因 此 对 于 语料库 翻译 学 的 发 展 来 说 ,有 两 大 
关键 点 :一 是 双语 库 的 研制 , 它 是 技术 手段 ,是 基础 设施 ,也 体现 研制 者 的 研究 目 
的 ;其 加 工 方 式 和 程度 直接 影响 研究 课题 的 开展 。 二 是 研究 切入 点 , 即 利用 双语 库 
能 给 翻译 研究 带 来 什么 新 发 现 .新 解释 , 它 关 系 到 语料库 翻译 学 如 何 解决 翻译 上 的 
各 种 问题 ,或 如 何 深化 人 们 对 翻译 现象 和 活动 的 认识 。 

本 从 书 为 国内 (迄今 为 止 也 是 国际 上 ) 第 一 套 基 于 语料库 的 翻译 研究 系列 专 
著 ,主要 选 题 有 “语料库 翻译 学 探索 "“ 语 料 库 翻译 学 概论 "“ 类 上 比 语料库 及 其 研 
究 ”“ 基 于 语料库 的 翻译 语言 特征 研究 ”"“ 基 于 语料库 的 翻译 文体 研究 ”"“ 基 于 语 
料 库 的 翻译 搭配 研究 ”“ 莎 士 比 亚 戏剧 英汉 平行 语料库 的 创建 与 应 用 研究 ”“ 语 料 
库 与 翻译 教学 ”等 。 其 最 大 特点 有 三 。 一 是 研究 者 均 为 国内 本 领域 专家 ,著作 为 国 
家 和 省 部 级 科研 项 目 成 果 ; 二 是 所 收 专著 各 有 专攻 ,覆盖 平行 语料库 、 翻 译 语料库 
和 类 比 语料库 三 方面 研究 ;三 是 成 果 为 第 一 批 与 中 文 相关 的 语料库 翻译 学 文献 ,并 
伴 有 一 批语 料 库 的 建立 和 充实 。 

语料库 翻译 学 逐步 从 方法 论 发 展 成 为 连贯 .综合 ,丰富 的 范式 ,应 用 于 翻译 理 
论 以 及 翻译 的 描写 和 实践 等 一 系列 问题 的 探讨 。 新 的 研究 范式 带 来 了 研究 思路 的 
更 新 和 研究 重点 的 转移 。 编 者 和 作者 期 盼 这 套 丛 书 能 促进 我 国 的 翻译 和 语料库 两 
方面 学 术 研 究 的 更 大 发 展 。 


王 克 非 
2011 年 夏 书 于 北 外 家 中 
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在 过 去 的 20 多 年 里 ,语料库 语言 学 的 迅速 发 展 给 包括 翻译 学 在 内 的 语言 研究 
带 来 了 一 场 革 命 。 翻 译 学 研究 领域 于 20 世纪 50 年 代 盛 行规 范 研究 ,并 于 80 年 代 
开始 向 描写 研究 转变 。 这 种 研究 范式 的 转变 与 语料库 语言 学 的 兴起 与 发 展 不 无 关 
系 ,因为 描写 翻译 学 和 语料库 语言 学 的 主要 关注 / 点 和 研究 对 象 都 是 实际 文本 ， 两 者 
都 属于 实证 研究 。 

翻译 研究 从 规范 向 描写 范式 的 转变 ,加 上 多 语种 语料库 在 90 年 代 的 发 展 ， 促 
成 了 语料库 翻译 学 的 诞生 。 可 以 说 语料库 翻译 研究 已 成 为 目前 翻译 研究 的 主流 ， 
国内 外 在 过 去 十 年 中 出 版 了 十 多 部 相关 专著 与 专题 论文 以 及 大 量 的 研究 论文 。 然 
而 ,这 些 研究 大 多 可 分 为 两 类 ,一 类 是 介绍 语料库 在 翻译 研究 中 的 应 用 , 另 一 类 是 
用 语料库 方法 来 研究 具体 的 语言 特征 等 。 

然而 ,语料库 翻译 学 不 仅仅 是 语料库 语言 学 作为 一 一 种 研究 方法 在 翻译 学 中 的 
运用 ,而 是 已 经 发 展 成 为 一 种 复合 型 的 研究 范式 ,为 翻译 研究 、 翻 译 实践 、 及 翻译 教 
学 提 新 的 理论 框架 。 虽 然 语料库 语言 学 和 译 学 界 都 认识 到 语料库 和 翻译 研究 的 有 
机 结合 已 形成 “语料库 翻译 学 ?这 门 新 的 分 支 学 科 , 但 遗憾 的 是 现 有 研究 还 没有 对 
该 学 科 的 性 质 、 范 围 及 方法 进行 准确 .系统 的 学 科 定位 。 

王 克 非 先生 的 《语料库 翻译 学 探索 ) 在 这 方面 作出 了 有 益 的 探索 。 作 者 在 系统 
地 回顾 语料库 翻译 研究 发 展 历程 的 基础 上 ,对 语料库 翻译 学 作为 一 种 新 的 研究 范 
式 其 理据 ,总 体 构架 、 研 究 范畴、 研究 方法 及 其 有 待 解决 的 范式 问题 等 学 科 定位 因 
素 进行 了 详尽 的 讨论 。 这 本 专著 的 特点 可 以 用 三 个 “兼顾 ”来 概括 :兼顾 理论 研究 
与 实际 应 用 ,兼顾 理论 探讨 与 实证 案例 ,兼顾 翻译 研究 与 翻译 教学 。 这 可 以 说 是 近 
年 来 语料库 翻译 研究 中 一 部 不 可 多 得 的 里 程 碑 式 的 力作 。 


肖 忠 华 
2011 年 7 月 于 兰 开 斯 特 
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第 工 章 


语料库 翻译 学 概要 


语料库 的 兴起 带 来 研究 工具 和 研究 方法 的 更 新 ,进而 导致 语料库 语言 学 和 语 
料 库 翻译 学 的 产生 。 本 章 介 绍 了 语料库 翻译 学 的 定义 ,基本 理念 .主要 研究 内 容 和 
研究 途径 ,讨论 如 何在 描写 研究 应 用 研究 和 理论 研究 三 方面 展开 新 课题 研究 。 语 
料 库 资 源 的 共享 ,检索 工具 的 不 断 研制 和 更 新 ,使 语言 和 翻译 的 研究 范围 从 语 际 对 
比 扩大 到 语 内 类 比 ,呈现 出 双向 多 重 的 对 比 模式 ,其 意义 不 仅 在 理论 上 ,在 对 翻译 
现象 (也 包括 双语 对 比 ) 的 描述 和 翻译 教学 的 改进 方面 也 具有 重要 的 应 用 价值 。 

新 技术 往往 带 来 新 的 认识 工具 和 新 的 研究 手段 。 计 算 机 技术 的 发 展 使 超大 规 
模 语 料 的 收集 ,整理 , 标 注 、 观 察 .统计 成 为 可 能 ,从 而 也 使 人 们 对 语言 的 认识 有 了 
更 宏观 的 视角 ,于 是 发 展 出 现代 语料库 语言 学 。 这 一 新 型 分 支 学 科 开展 的 20 多 年 
来 ,一 方面 提供 了 新 的 语言 考察 和 分 析 手 段 ,一 方面 也 推进 了 依据 语料库 大 量 语言 
事实 所 做 的 关于 语言 的 理论 思考 。 正 如 Johansson(2007;1) 指 出 的 :“ 通 过 语料库 ， 
我 们 可 以 观察 先前 没有 意识 到 或 仅仅 隐约 觉察 到 的 语言 模式 ”。 语 料 库 带 来 的 不 
只 是 语言 学 研究 上 的 更 新 ,还 包括 翻译 学 研究 方法 上 的 更 新 。 语 料 库 翻 译 学 的 发 
展 ,使 研究 者 得 以 对 大 量 真实 语 料 (尤其 是 双语 /多 语 平行 语 料 , 包 括 书 面 语 和 口 
语 ) 进 行 对 比分 析 , 这 为 语言 对 比 和 翻译 研究 提供 了 新 的 契机 。 


1.1 语料库 翻译 学 的 定义 


翻译 研究 历来 重视 语言 文本 的 比较 ,因此 在 理论 上 多 借鉴 语言 学 ,在 方法 上 
多 采用 描写 法 、 比 较 法 。 一 脉 传承 下 来 , 便 有 了 现代 的 语料库 翻译 研究 。 在 语料库 
的 支持 下 ,“ 翻 译 学 理论 研究 的 重心 转向 ,从 原文 与 译文 的 比较 或 A 语言 与 B 语 言 
的 比较 ,转向 文本 生成 本 身 与 翻译 的 比较 ”(Baker 1995:233)。Baker(1996:175) 
进而 提出 “基于 语料库 的 翻译 研究 ”(corpus-based translation studies)。 此 后 ， 
Tymoczko(1998:1) 将 基于 语料库 的 翻译 研究 称 为 “语料库 翻译 研究 ”(corpus 
translation studies, 简 称 CTS) 。Baker 的 学 生 Laviosa(1998:1) 更 提出 翻译 研究 中 
的 语料库 途径 是 翻译 研究 的 一 种 “新 范式 ”(a new paradigm), 
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鉴于 基于 语料库 的 语言 学 研究 通称 为 语料库 语言 学 ,因此 ,我 们 也 不 妨 把 “ 基 
于 语料库 的 翻译 研究 ” 称 为 语料库 翻译 学 。 若 尝试 为 语料库 翻译 学 作 一 定义 ,我 们 
认为 : 

语料库 翻译 学 是 以 语言 理论 和 翻译 理论 为 研究 上 的 指导 , 以 概率 和 统计 为 手 
段 , 以 大 规模 双语 真实 语 料 为 对 象 ,采用 语 内 对 比 与 语 际 对 比 相 结合 的 方法 ,对 翻 
译 现象 进行 历时 或 共 时 的 描写 和 解释 ,探索 翻译 本 质 的 一 种 翻译 学 研究 方法 (参看 
王 克 非 、 黄 立波 2007). 

我 们 说 语料库 翻译 学 有 语言 学 理论 背景 ,是 因为 以 J. R. Firth, M. A. K. 
Halliday 和 John Sinclair 为 代表 的 英国 语言 学 传统 思想 是 语料库 语言 学 的 直接 理 
论 源头 (Stubbs 1993) 。 该 学 派 认为 语言 研究 应 以 真实 数据 为 基础 , 即 以 真实 文本 
为 主要 研究 对 象 进行 实证 研究 ,内 省 式 例子 本 身 是 解释 行为 的 一 部 分 ;将 文本 整体 
作为 研究 的 基本 单位 ;基于 文本 语 料 的 研究 以 对 比 为 基本 模式 (同上 :8-13)。 这 些 
思想 一 方面 打破 了 传统 语言 研究 建立 在 内 省 数据 基础 上 演绎 式 、 规 定性 的 规则 系 
统 , 另 一 方面 打破 了 关注 语言 ,忽略 言语 的 倾向 , 转 而 对 一 定 社会 文化 语 境 中 具体 
的 语言 使 用 进行 描写 和 解释 ,这 些 间 接地 为 语料库 翻译 学 提供 了 理论 依据 。 大 规 
模 语 料 库 可 以 帮助 翻译 研究 者 重新 审视 其 研究 对 象 , 探究 翻译 研究 对 象 不 同 于 其 
他 研究 对 象 的 原因 , 同时 探索 指导 翻译 行为 的 原则 以 及 制约 翻译 运作 的 因素 。 描 
写 翻 译 研究 握 弃 了 内 省 法 ,从 描写 真实 语 料 出 发 ,达到 对 翻译 现象 的 解释 和 预测 。 
这 些 均 为 基于 语料库 的 翻译 研究 范式 提供 了 直接 理论 支持 。 

总 之 ,无 论 是 基于 语料库 还 是 为 语料库 所 驱动 的 研究 ,都 为 研究 者 带 来 不 少 新 
的 课题 ,从 而 吸引 更 多 的 研究 人 员 , 并 有 可 能 突破 原来 的 研究 局 面 , 带 来 新 的 启示 
和 进展 。 


1.2 语料库 翻译 学 的 基本 理念 


20 世纪 后 半期 以 来 ,翻译 研究 主要 还 是 限于 探讨 译文 与 原文 之 间 的 关系 ,这 
种 二 元 对 立 的 做 法 常常 将 译文 视 为 原文 的 衍生 物 , 在 此 基础 上 的 理论 研究 本 质 上 
依然 是 对 译文 质量 的 回潮 式 评估 ,这 种 模式 在 一 定 程度 上 局 限 了 翻译 研究 的 进 一 
步 发 展 。 从 翻译 研究 本 身 讲 ,语料库 翻译 学 有 两 方面 理论 发 展 的 支持 :其 一 ,语义 
观 转变 为 情境 观 ,突破 了 传统 的 “对 等 ”将 其 视 为 一 定 社会 文化 情境 中 语言 使 用 的 
对 应 ;第 二 ,描写 翻译 研究 范式 打破 了 原作 的 主宰 地 位 (Baker 1993: 236-241; 
Laviosa 2002:5)。 可 见 ,语料库 翻译 学 的 兴起 是 以 突破 “对 等 ”为 核心 概念 工具 的 
源 文本 取向 模式 (ST-oriented model) ,由 规定 转向 描写 ,以 大 规模 翻译 文本 作为 数 
据 来 源 ,结合 计算 机 分 析 技 术 的 基础 上 产生 的 。 描 写 翻译 研 究 率先 抛 开 了 传统 做 
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法 ,对 语言 相互 作用 及 其 影响 .目标 语文 化 内 部 制约 翻译 活动 的 种 种 文本 外 因素 给 
予 了 更 多 关注 ,将 翻译 研究 视 为 一 个 跨 学 科 领 域 ,从 多 个 视角 加 以 审视 。 

语料库 翻译 学 以 翻译 本 体 为 研究 对 象 , 由 大 规模 翻译 文本 或 翻译 语言 整体 人 
手 , 采 用 语 内 对 比 与 语 际 对 比 相 结合 的 模式 ,对 翻译 现象 进行 描写 和 解释 ,探索 翻 
译 的 本 质 。 


13 语料库 翻译 学 的 主要 研究 内 容 


既然 语料库 翻译 学 是 基于 语料库 的 研究 ,语料库 翻译 学 要 借鉴 语料库 语言 学 
的 基本 方法 ,包括 语 料 的 整理 ,标注 检索 、 统 计 等 ,但 也 有 它 独特 之 处 。 首 先是 所 
据 语料库 不 同 。 语 料 库 语言 学 依据 单 语 语料库 即 可 ,语料库 翻译 学 一 般 要 依靠 双 
语 语料库 ,主要 是 翻译 语料库 (translational corpus) 、 对 应 语料库 (parallel corpus) 
和 类 上 比 语料库 (comparable corpus) 。 其 次 是 双语 语料库 在 标注 方面 更 加 复杂 。 如 
翻译 语料库 需要 对 翻译 、 译 者 等 要 素 加 以 详细 标注 ,对 应 语料库 需要 对 两 种 语 料 做 
句子 或 某 种 层级 上 的 对 齐 处 理 , 类 比 语料库 需要 对 文体 .主题 作者 、 译 者 等 要 素 加 
以 信息 标注 。 再 次 是 研究 对 象 有 别 。 语 料 库 翻 译 学 探究 的 是 两 种 语言 及 其 转换 的 
过 程 ,特征 和 规律 。 

传统 的 翻译 研究 是 以 原 语文 本 为 参照 ,以 忠实 程度 为 取向 , 主要 探讨 译文 与 原 
文 之 间 的 关系 或 对 应 关系 。 语 料 库 翻 译 学 基本 上 就 是 语料库 语言 学 加 描写 翻译 研 
究 。 这 也 可 以 说 是 一 种 新 的 研究 范式 。 因 为 基于 语料库 的 翻译 研究 途径 正在 逐步 
从 方法 论 发 展 成 为 连贯 .综合 ,丰富 的 范式 ,应 用 于 翻译 理论 以 及 翻译 的 描写 和 实 
践 等 一 系列 问题 的 探讨 。 新 的 研究 方法 会 促进 研究 范式 的 形成 和 发 展 ,新 的 研究 
范式 将 带 来 研究 思路 的 更 新 和 研究 重点 的 转移 ,这 是 特别 值得 注意 的 。 

由 此 我 们 可 以 概括 地 说 ,语料库 翻译 学 至 少 有 三 大 应 用 的 和 理论 的 研究 内 容 ， 


一 、 大 范围 的 翻译 调查 ,包括 翻译 教学 、 翻 译文 体 的 考察 ,以 及 对 应 词 拱 
配 频率 等 统计 数据 的 检索 与 分 析 ; 

二 、 自动 翻译 研究 ,将 开展 了 半 个 世纪 的 机 器 翻译 与 语料库 翻译 结合 起 
来 ,以 期 取得 新 的 实质 性 突破 ; 

三 、 更 广泛 更 有 效 地 描写 翻译 研究 ,包括 翻译 规范 的 研究 和 翻译 普遍 特 
征 或 共性 的 研究 。 


Mona Baker 是 最 早 进行 语料库 翻译 学 研究 的 学 者 之 一 。 她 在 “语料库 语言 学 和 
翻译 研究 :启示 与 应 用 (Corpus Linguistics and Translation Studies: Implications 
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and Applications)”1993) 一 文中 对 这 两 者 的 结合 作 了 初步 阐发 。 在 大 范围 翻译 调 
查 方面 ,如 翻译 文体 的 考察 ,她 (2000) 也 率先 从 语料库 角度 探讨 译 者 的 文体 特征 ， 
特别 是 从 类 符 - 形 符 比 .平均 名 长 及 词 项 使 用 特点 等 方面 加 以 分 析 。 

关于 第 二 个 研究 指向 ,主要 是 将 基于 规则 的 研究 方法 (rule-based approach) 同 
基于 语 料 的 研究 方法 (corpus-based approach) 相 结合 ,为 自动 翻译 寻找 出 更 便利 可 
行 的 途径 。 

值得 关注 的 是 第 三 点 , 即 语料库 基础 上 的 描写 翻译 研究 ,特别 是 有 关 翻 译 共性 
问题 的 探讨 。Baker 在 前 人 研究 成 果 的 基础 上 ,提出 了 翻译 普遍 特征 (universal 
features of translation) 的 假设 ,主要 内 容 是 翻译 文本 中 的 1) 显 化 (explicitation); 
2) 消 歧 (disambiguation) 和 简化 (simplification) ;3) 范 化 (normalization) ;4) 避免 重 
复 ;5) 凸 显 目标 语 语言 特征 ;6) 某 些 特征 呈现 特定 类 型 的 分 布 。 此 外 , Laviosa 调查 
了 英语 翻译 文本 中 的 四 种 核心 词汇 运用 模式 ;Kenny 通过 对 原文 ,译文 的 语义 韵 比 
较 ,发 现 译文 语言 有 净化 (sanitisation) 现 象 ;Overas 考察 了 英语 -挪威 语 翻 译 中 衔 
接 层面 上 的 显 化 现象 ; 王 克 非 据 大 型 对 应 语料库 探讨 了 译本 扩 增 情况 ;Laviosa 讨 
论 译文 与 母语 在 词汇 使 用 上 的 不 同 ; 柯 飞 通过 语料库 考察 ,发 现 翻译 过 程 中 对 原文 
的 模仿 可 能 使 译文 变 得 复杂 化 .元 长 化 ;Xiao & McEnery 发 现在 “ 体 ” 标 记 的 使 用 
上 ,汉语 译文 比 汉语 原文 多 出 约 一 倍 ; Ebeling 比较 了 英语 和 挪威 语 在 存 现 句 使 用 
上 的 特点 ;Maia 以 双语 对 应 语料库 观察 英语 和 葡萄 牙 语 在 人 称 主语 使 用 频率 上 的 
差异 ,等 等 ( 王 克 非 2004b:182-183) 。 

从 这 些 文献 可 以 看 出 ,语料库 翻译 学 在 研究 方法 上 以 语言 学 理论 为 指导 ,以 概 
率 和 统计 为 手段 ,以 双语 真实 语 料 为 对 象 ,对 翻译 进行 历时 或 共 时 的 研究 ,代表 了 
一 种 新 的 研究 范式 。 


1.4 语料库 翻译 学 的 基本 途径 


从 古今 中 外 的 翻译 实践 和 论述 看 ,最 自然 的 翻译 研究 途径 ,也 是 传统 的 途径 ， 
便 是 以 源 文本 为 参照 ,以 忠实 程度 为 取向 ,主要 探讨 译文 与 原文 之 间 的 关系 或 对 应 
关系 。 这 种 二 元 对 立 的 思路 往往 将 译文 视 为 原文 衍生 物 ,在 此 基础 上 的 理论 研究 
本 质 上 是 对 译文 质量 的 回溯 式 评估 ,这 种 模式 在 一 定 程度 上 有 碍 于 翻译 研究 的 发 
展 。 近 30 年 来 ,国内 外 学 者 不 断 有 人 尝试 打破 这 种 局 面 ,探讨 新 的 研究 路 径 。 如 
Even-Zohar 等 人 提出 多 元 系统 理论 ,试图 不 仅 从 语言 还 要 从 翻译 外 部 即 社会 文化 
层面 上 解释 翻译 现象 ,提升 了 目标 语文 化 语 境 对 于 翻译 的 作用 ; 又 如 Holmes 和 
Toury 等 人 提出 描写 翻译 研究 法 ,一 方面 重视 翻译 规范 (translation norms) 的 研 
究 , 另 一 方面 也 试图 探究 翻译 的 普遍 性 特征 (universal features of translation), i= 
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料 库 的 发 展 ,特别 是 双语 语料库 的 研制 ,使 描写 翻译 研究 得 以 更 充分 地 展开 ,基于 
语料库 的 翻译 研究 途径 在 逐步 从 方法 论 发 展 成 为 连贯 .综合 .丰富 的 范式 ,应 用 于 
翻译 理论 以 及 翻译 的 描写 和 实践 等 一 系列 问题 的 探讨 。 


1.5 小 结 


综 上 所 述 ,语料库 翻译 学 特别 关注 三 方面 的 探讨 : 

第 一 ,描写 研究 :包括 大 范围 的 翻译 调查 、 翻 译文 体 考察 ,不 同 译本 的 参数 比 
较 ,以 及 语句 的 对 应 情况 ,对 应 词 和 短语 的 搭配 及 其 频率 等 统计 数据 的 检索 与 
分 析 。 

第 二 ,应 用 研究 :如 自动 翻译 研究 ,将 开展 了 半 个 世纪 的 机 器 翻译 与 语料库 翻 
译 结合 起 来 ,以 期 取得 新 的 实质 性 突破 ;又 如 翻译 教学 ,大 量 的 对 应 本 章 和 语句 的 
呈现 ,有 利于 学 习 者 翻译 意识 的 养 成 和 翻译 技巧 的 自我 提高 ;在 双语 词典 的 编纂 方 
面 , 显 而 易 见 的 是 可 以 丰富 例证 和 提供 搭配 情况 ,频率 ` 反 向 检索 等 数据 。 

第 三 ,理论 研究 :使 更 广泛 .有效 的 描写 翻译 研究 得 以 展开 ,包括 翻译 规范 的 研 
究 和 翻译 普遍 特征 或 日 共性 的 研究 ;还 可 以 结合 翻译 研究 进行 双语 的 对 比分 析 , 有 
助 于 丰富 人 们 对 语言 的 认识 以 及 对 语言 习 得 的 认识 。 


第 2 章 


语料库 驱动 语言 与 翻译 研究 


随 着 计算 机 技术 和 语料库 语言 学 的 快速 发 展 ,大 规模 语 料 的 收集 ,整理 和 标注 
加 工 已 经 实现 。 如 何在 此 基础 上 ,将 描写 与 实证 分 析 相 结合 ,定性 研究 与 定量 研究 
相 结合 ,更 充分 地 解释 各 种 语言 现象 ,是 语料库 语言 学 的 重要 任务 。 本 章 主要 讨论 
在 双语 语料库 驱动 下 的 语言 对 比分 析 和 翻译 研究 等 方面 问题 ,并 探讨 语料库 研究 
方法 和 语料库 驱动 下 的 一 系列 新 课题 。 


2.1 Corpus 的 含义 及 语料库 的 发 展 


RX corpus 一 词 源 于 拉丁 语 , 本 意 为 body( 身 体 、 艇 体 )。18 世纪 后 ,该 词 开 
始 用 于 指称 “关于 某 一 主题 文字 形式 的 汇编 全集”; 到 20 世纪 50 ER, corpus 一 
词 逐渐 具有 现代 意义 上 的 “语料库 ”的 含义 , 指 “ 用 于 进行 语言 分 析 而 收集 的 大 量 书 
面 语 或 口语 资料 ”OED,1989:959) ;60 年 代 第 一 个 机 读 语 料 库 即 布朗 语料库 (the 
Brown Corpus) (Kennedy 1998:23;Kenny 2001:24) 在 美国 建立 ,标志 着 现代 计算 
机 语料库 的 诞生 ,corpus 一 词 也 完成 了 它 到 目前 为 止 在 意义 上 的 演化 了, 成 为 “ 语 
料 库 ”。 人 们 通常 误 以 为 语料库 是 伴随 计算 机 的 发 明 而 逐步 出 现 的 ,其 实 原始 意义 
上 的 手工 语料库 出 现 得 更 早 ,甚至 可 以 追溯 到 中 世纪 ( 杨 惠 中 2002: 46)。 按 照 
Kennedy 的 说 法 ,最 早 的 涉及 语言 研究 性 质 的 语料库 始 于 18 世纪 以 基督 教 ( 圣 经 》 
为 基础 的 词汇 索引 ,用 于 语汇 检索 以 及 证 明 《 圣 经 ) 文 本 意义 在 整体 上 的 一 致 性 
(Kennedy 1998:13-14)。Francis(1992) 认 为 计算 机 出 现 之 前 的 最 早 的 语料库 开始 
于 1775 年 Dr. Johnson 编写 的 《英语 词典 》(A Dictionary of the English 
Language) (Kenny 2001:23-24) ,因为 这 部 词典 不 仅 收 词 丰富 ,释义 准确 ,而 且 大 


© “corpus" 一 词 在 意义 上 大 致 经 历 了 这 样 一 个 变化 过 程 :“ 身 体 ” 一 “尸体 ”一 “汇编 ,全 集 ” 一 
“(口语 或 书面 语 的 ) 语 料 ”>“ 语 料 库 ”(OED 1989:959)。《 牛 津 高 阶 英汉 双 解 词典 )( 第 6 版 ) 中 
对 “corpus” 一 词 的 释义 为 “(书面 或 口语 的 ) 文 集 ,文献 ;汇编 ;语料库 ”(p. 376), 由 此 也 可 以 看 出 
语料库 的 发 展 过 程 。 
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量 引用 著名 作家 及 其 经 典 作品 中 的 语言 来 说 明 词义 和 用 法 。 然 而 ,第 一 个 现代 意 
义 上 的 语料库 却 应 当 毫 无 争议 地 归功 于 Randolph Quirk 于 20 世纪 50 ERRE 
伦敦 大 学 建立 的 “英语 用 法 调查 ”(Survey of English Usage) 语 料 库 O( 同 上 :24; 王 
克 非 2004b:3) 。 

语料库 从 本 质 上 讲 , 就 是 “依照 某 种 原则 方式 所 收集 的 大 量 文本 总 汇 ”(Kenny 
2001; 22) 。 今 天 我 们 在 语言 学 研究 中 所 谈 到 的 语料库 ,是 指 运用 计算 机 技术 , 按 
照 一 定 的 语言 学 原则 ,根据 特定 的 语言 研究 目的 而 大 规模 收集 并 贮存 在 计算 机 中 
的 真实 语 料 , 这 些 语 料 经 过 一 定 程 度 的 标注 ,便于 检索 ,可 应 用 于 描述 研究 与 实证 
研究 。 由 此 可 见 , 以 计算 机 技术 的 应 用 为 标志 ,语料库 的 发 展 经 历 了 三 个 阶段 : 原 
始 语料库 、 现 代 语料库 和 当代 语料库 。 原 始 意义 上 的 语料库 主要 指 计算 机 出 现 之 
前 以 语汇 索引 、\ 词 典 编 繁 ,方言 研究 ,语言 教学 研究 和 语法 研究 为 主要 代表 的 原始 
手工 语料库 ,其 最 显著 的 特点 就 是 对 经 典 文本 语 料 的 手工 收集 。 现 代 意 义 上 的 语 
料 库 包 括 运用 计算 机 技术 大 规模 收集 多 种 文本 语 料 的 电子 语料库 ,其 主要 有 三 个 
特点 :大 规模 的 真实 语 料 ; 经 过 一 定 的 标注 处 理 ;便于 检索 。 当 代 语 料 库 是 指 90 年 
代 以 共 建 英语 语料库 (COBUILD) 、 朗 文 语料库 (LONGMAN) 、 英 国 国 家 语料库 
(BNC) 以 及 国际 英语 语料库 (ICE) 为 代表 的 超级 语料库 (mega-corpora) ,它们 的 容 
量 更 大 , 收 词 量 大 都 上 亿 , 覆 盖 面 更 宽 ,应 用 更 广 ( 见 表 2. 1)。 


表 2.1 语料库 的 三 个 发 展 阶段 


发 展 阶段 | 时 其 特点 及 应 用 典型 代表 
手工 收集 原 语 料 ;无 标注 。 主 Alexander Cruden 于 1736 年 出 
s 版 的 钦定 版 (圣经 》 语 汇 检索 ; 
18 世纪 ~ 20 | 要 应 用 于 语汇 索引 、 词 典 编 繁 、 
原始 语料库 e vz, | Dr. Johnson F 1755 年 出 版 的 
tta AATRE BEDAE | (英语 词典) CA Dian 
法 研究 ictionary of 
the English Language) 
i pa 
由 手工 收集 向 计算 机 语料库 过 | Weeo ph Quirk 的 村 语 用 法 
a e Survey of English 
20 世纪 so~ | EIPRE EEREN | Usage) 语料库 ; 布朗 语料库 
现代 语料库 进行 标注 。 主 要 用 于 语法 分 析 pe 
80 年 代 和 语言 对 比 研究 ,逐渐 涉及 其 (the Brown Corpus); 兰 开 斯 
特 -奥斯陆 - 卑 尔 根 (LOB) 语 料 
他 领域 ES 


D “英语 用 法 调查 "语料库 仍 以 人 工 收集 为 主 , 既 包 括 书 面 语 也 包括 口语 ,建立 该 语料库 


的 初衷 是 要 编写 一 部 “标准 ”英语 语法 ,起 初 没 有 计划 借助 计算 机 技术 。 但 其 中 的 口语 部 分 经 过 
计算 机 处 理 包括 在 伦敦 - 隆 德语 料 库 中 (Svartvik 1990, 转 引 自 Kenny 2001:24) ,因此 它 是 语料库 
由 人 工 处 理 向 计算 机 处 理 过 渡 阶 段 的 代表 。 
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( 续 表 ) 
发 展 阶段 时 期 特点 及 应 用 典型 代表 
语料库 呈现 超大 规模 趋势 ;类 | 共 建 英语 语料库 (the Cobuild 
20 世 纪 90 年 型 更 加 丰富 ,应 用 更 加 广泛 , 包 | Bank of English); 朗 文 语料库 
当代 语料库 RES 括 :语言 研究 .对比 研究 、 翻 译 | (Longman); 英 国 国家 语料库 
研究 ,教学 研究 词典 编纂 ,以 及 | CBNC) ;国际 英语 语料库 (ICE) 
机 器 翻译 和 软件 开发 等 等 


需要 指出 的 是 ,第 一 ,语料库 的 演变 过 程 说 明 “ 语 料 库 ”这 一 概念 由 来 已 久 , 其 
雏形 早 在 18 世纪 甚至 更 早 就 已 经 出 现 ,今天 语料库 语言 学 中 所 讲 的 “语料库 ”是 一 
个 以 计算 机 技术 应 用 为 标志 的 现代 概念 ,也 就 是 说 “corpus” 或 “corpora” 并 不 一 定 
等 于 现代 意义 上 的 “语料库 ”第 二 ,早期 的 语料库 主要 是 对 原 语 料 (raw material) 
的 人 工 收集 ,用 作 语 汇 索引 、 词 典 编 繁 ,语法 研究 ,方言 研究 和 语言 教学 研究 的 原始 
语 料 , 以 书面 语 为 主 ,而 现代 意义 上 的 语料库 种 类 繁多 ,主要 借助 计算 机 手段 ,在 一 
定 的 语言 学 理论 的 指导 下 对 语 料 在 各 个 层次 上 进行 了 标注 ,应 用 范围 涉及 语言 研 
究 、. 对 比 研究 .翻译 研究 教学 研究 以 及 词典 编纂 等 众多 领域 ;第 三 ,当代 语料库 的 设 
计 、 研 制 和 应 用 以 印 欧 语 系 内 部 语种 (尤其 是 英语 ) 为 主 ,尚未 普及 到 世界 各 种 语言 。 


2.2 语料库 的 分 类 与 应 用 


语料库 是 一 个 多 角度 、 多 层次 的 研究 工具 ,因此 对 其 分 类 也 显得 纷繁 复杂 , 没 
有 统一 的 划分 。 从 语 料 内 容 上 可 分 为 :书面 语 与 口语 、 共 时 与 历时 以 及 原创 语言 与 
翻译 语言 ;从 选材 方式 上 可 分 为 :抽样 型 和 监控 型 ;按照 语言 数量 可 分 为 : 单 语 的 、 
双语 /平行 的 和 多 语 的 ;从 用 途 方面 又 可 分 为 :普通 语 料 和 专门 用 途 语 料 。 而 且 每 
个 语料库 还 可 进一步 细 分 成 一 些 子 库 。 一 般 来 说 ,研究 目的 与 方法 是 语料库 类 型 
的 根本 决定 因素 ,基于 此 ,我 们 可 以 对 语料库 做 一 分 类 ( 见 图 2. 1) 。 

以 上 分 类 主要 依据 语言 数量 ,文本 间 是 否 具有 翻译 关系 或 对 齐 关 系 ( 王 克 非 
2004b:6-9)。 大 体 上 说 ,语料库 的 应 用 涉及 以 下 几 个 方面 :语言 研究 .对比 研究 、 翻 
译 研 究 、 语 言 /翻译 教学 研究 , 单 语 /双语 词典 研 编 以 及 机 助 /机 器 翻译 与 翻译 软件 
开发 等 ( 见 表 2. 2) 。 

由 表 2. 2 可 以 看 出 ,与 翻译 研究 有 关 的 语料库 主要 包括 三 类 :翻译 语料库 ,对 
应 /平行 语料库 ,其 中 以 对 应 语料库 最 为 突出 ,其 最 大 的 特点 在 于 包括 了 两 种 原创 
语言 文本 和 与 之 对 应 的 两 种 翻译 语言 文本 ,可 以 用 于 多 种 用 途 。 语 言 研究 和 翻译 
研究 向 来 重视 语言 材料 的 收集 , 而 基于 大 规模 电子 语 料 文本 库 的 语言 与 翻译 研究 
更 具有 以 下 四 个 特点 :第 一 ,大 规模 的 真实 语 料 ;第 二 , 共 时 与 历时 的 结合 ;第 三 , 定 
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性 研究 与 定量 研究 的 结合 ;第 四 ,理论 与 实践 的 结合 。 这 些 特点 集中 体现 了 理论 研 
究 中 的 继承 性 与 创造 性 。 
语料库 


EE 


书面 语 语料库 口语 语料库 
共 时 语料库 历时 语料库 


j 1 
单 语 语料库 双语 语料库 多 语 语料库 


[ga 有 RE 


单一 原创 单一 翻译 ”翻译 ”对 应 /平行 类 比 翻译 对 应 /平行 ”类比 
语言 语言 


rt rh 


单 向 双向 多 向 单 语 双语 
对 应 对 应 对 应 


图 2.1 语料库 的 简单 分 类 
(Granger 2003; 王 克 非 2004b:8) 


表 2.2 语料库 的 应 用 


语言 | 对 比 | 翻译 | 语言 /| 单 /双语 | 机 助 /翻译 与 
语料库 类 型 研究 | 研究 | 研究 | 翻译 教学 | 词典 研 编 | 翻译 软件 开发 
ene | 单一 原创 语言 | V | v 
单 语 语料库 | 单一 翻译 语言 | J zi 
翻译 Jo af pe 
双语 语料库 | 对 应 /平行 | V Tv |vV| v 以 以 
类 比 i 
翻译 vv vv 
多 语 语料库 | 对 应 /平行 viv v Vv v 以 
类 比 JAEN. 


2.3 ”基于 双语 库 的 语言 对 比分 析 


对 比 语言 学 的 源头 大 约 可 以 追溯 到 19 世纪 末 20 世纪 初 的 对 比分 析 @ 研 究 ,但 


外 “对 比 语言 学 "(contrastive linguistics) 与 “对 比分 析 ”(contrastive analysis) 可 互 换 , 王 宗 
炎 指 出 ,对 比分 析 或 对 比 语言 学 不 同 于 比较 语言 学 (comparative linguistics) 。 比 较 语言 学 是 历 
时 性 研究 , 它 追 究 语言 之 间 的 谱系 关系 ;对 比分 析 是 共 时 性 研究 , 它 追 究 语言 之 间 的 一 致 性 和 分 
歧 性 一 尤其 是 分 歧 性 。”(2000:111) 


12 // 语料库 翻译 学 探索 


最 早 提出 “对 比 语言 学 ”的 通常 认为 是 20 世纪 美国 的 语言 学 家 Benjamin Lee 
Whorf( 王 宗 炎 2000:112) ,而 后 这 一 学 科 经 历 了 一 个 盛衰 起 伏 的 过 程 。 对 比 语言 
学 与 翻译 研究 有 着 一 种 不 解 之 缘 , 两 者 统一 于 两 种 不 同 语言 之 间 的 相互 关系 当中 。 
两 种 研究 的 最 终 目 标 不 尽 相同 ,但 两 个 领域 却 存在 一 种 互补 关系 。 对 比分 析 是 翻 
译 实践 不 可 或 缺 的 步骤 ,翻译 实践 是 对 比分 析 的 重要 手段 ,在 一 定 程度 上 两 者 互 为 
研究 方法 和 对 象 。 对 语 料 的 关注 是 对 比 语言 学 和 翻译 研究 最 大 的 共同 之 处 ,近年 来 
语料库 语言 学 与 计算 机 技术 的 结合 和 飞速 发 展 , 使 得 对 大 量 真 实 语 料 ( 尤 其 是 双语 / 
多 语 平行 语 料 ) 的 对 比分 析 成 为 可 能 ,这 为 对 比 语言 学 和 翻译 研究 提供 了 新 的 契机 。 
基于 单一 语言 语料库 的 语言 研究 成 果 非 常 丰富 ,基于 双语 语料库 开展 的 语言 
对 比分 析 还 不 多 见 。 这 主要 是 因 双 语 库 的 建设 难度 较 大 ,相对 滞后 。 不 过 随 着 双 
语 库 逐渐 为 学 界 所 重视 ,这 类 研究 也 开始 兴起 。 其 中 涉及 汉语 的 双语 对 比分 析 有 
肖 忠 华 、 王 克 非 、 熊 学 亮 . 曹 大 峰 、 施 建 军 、 柏 晓 静 和 人 詹 卫 东 等 ( 王 克 非 等 2004b), 论 
及 语言 的 体 、 被 动 句 、 把 字句 、 致 使 结构 、 动 结 结构 等 。 国 外 在 印 欧 语系 各 语言 之 间 
也 开展 了 一 些 研究 。 例 如 Davidse 和 Heyvaert(2003) 的 “ 论 英语 与 荷兰 语 中 的 中 
动 结构 ”(On the Middle Construction in English and Dutch) 一 文 , 将 语料库 和 对 
比 研究 结合 起 来 ,从 微观 角度 针对 现 有 英语 与 荷兰 语 中 有 关中 动 结构 的 理论 提出 
了 新 的 假设 。 作 者 指出 对 中 动 结构 的 现 有 分 析 方 法 主要 有 两 种 :1) 作 格 法 (the 
ergative view)，, 此 种 观点 认为 ,中 动 结构 中 不 存在 明确 的 施 事 者 (Agent) ,因此 结 
构 中 只 有 一 个 参与 者 , 施 事 行为 归于 主语 ,属于 唯 动 格 结构 的 范畴 ;2) 及 物 法 (the 
transitive approach) ,该 种 观点 认为 中 动 结构 包含 两 个 参与 者 即 隐 含 的 施 事 者 和 受 
事 者 性 质 的 主语 ,强调 主语 的 受 事 者 性 质 。 由 此 可 以 看 出 ,前 一 种 观点 认为 中 动 结 
构 属于 包含 一 个 施 事 主语 的 主动 语 态 结构 ,而 后 者 视 其 为 主语 为 受 事 者 的 被 动 结 
构 。 两 位 作者 指出 以 上 两 种 观点 均 存 在 缺陷 ,提出 中 动 结构 本 身 赋予 了 主语 与 动 
词 短语 之 间 一 种 内 在 的 配 价 关 系 ,由 中 动 结构 所 建立 的 非 施 事 主语 与 主动 动词 短 
语 之 间 的 关系 从 根本 说 是 情态 性 (modal) 的 。Hantson(2003) 在 其 “英语 动 名 词 结 
构 与 挪威 语 限定 词 十 不 定式 /at 从 名 结构 ”(English Gerund Clauses and 
Norwegian det 十 Infinitive/at Clause Constructions) 一 文中 从 英语 -挪威 语 对 比 的 
角度 人 手 , 探 讨 了 两 种 语言 特定 结构 之 间 的 特点 及 其 翻译 问题 。 文 中 既 有 对 传统 
观点 的 维护 ,也 有 借助 语料库 分 析 方 法 对 两 种 语言 进行 相关 统计 分 析 和 翻译 转换 
问题 的 探讨 。 但 是 这 类 语言 对 比分 析 的 研究 还 不 丰富 ,有 待 进一步 开展 。 


2.4 ”基于 双语 库 的 翻译 研究 


纵 观 翻译 理论 发 展 的 历史 ,到 20 世纪 90 年 代 初 为 止 ,翻译 研究 经 历 了 语文 研 
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究 、 语 言 学 研究 ,文化 研究 .哲学 研究 和 认 知 研究 五 个 范式 。 早 期 的 翻译 理论 以 文 
学 翻译 为 主要 研究 对 象 ,以 词汇 与 语义 的 关系 .是否 忠实 于 原作 、 译 文风 格 取向 以 
及 译 者 的 创造 力 等 语文 因素 来 建立 翻译 的 方法 论 体 系 ,这 一 研究 范式 开创 了 翻译 
理论 的 先河 ,为 后 来 翻译 理论 的 发 展 莫 定 了 基础 。 然 而 这 些 理论 大 多 仅 限 于 评论 
或 批评 性 质 的 个 人 经 验 总 结 , 抽象 而 模糊 。 到 了 20 世纪 50,60 年 代 , 以 Eugene 
A. Nida J. C. Catford 为 代表 ,产生 了 翻译 研究 的 语言 学 方法 体系 。 他 们 以 语 
言 学 理论 为 指导 ,采用 形式 分 析 的 方法 从 词汇 ,语法 、 句 法、 语义 . 语 用 、 语 篇 .功能 
等 层面 对 原 语文 本 和 译 语文 本 的 语言 进行 分 析 , 期 望 达到 对 翻译 问题 的 科学 解释 ， 
这 一 范式 一 直 延 续 到 今天 ,依然 是 翻译 研究 的 主流 方法 之 一 。 翻 译 的 文化 研究 范 
式 出 现 于 80 年 代 末 ,以 James Holmes(1972/1988) 的 “翻译 研究 的 名 与 实 ”(The 
Name and Nature of Translation Studies) 一 文 为 起 点 ,Bassnet 和 Lefevere 提出 了 
翻译 研究 的 文化 转向 ,将 研究 的 重心 转向 了 翻译 活动 所 涉及 的 诸多 社会 和 文化 因 
素 。 其 中 以 Even Zohar 的 多 元 系统 理论 最 为 突出 ,改变 了 以 往 以 “对 等 ”为 核心 的 
视角 ,使 翻译 研究 取得 了 新 的 突破 。 翻 译 的 哲学 研究 范式 由 来 已 久 , 早 在 19 世纪 
的 Schleiermacher 和 Benjamin 所 创立 的 诠释 学 (hermeneutic) 翻译 研究 方法 就 已 
经 为 后 期 的 解构 主义 翻译 观 奠定 了 基础 。 翻 译 认 知 研究 范式 以 认 知 科学 的 研究 为 
基础 , 旨 在 探究 翻译 过 程 中 译 者 头脑 中 的 “黑匣子 "(black box) ;这 个 领域 的 研究 方 
兴 未 父 。 以 上 这 五 种 范式 依然 渗透 于 今天 的 翻译 研究 当中 ,使 翻译 研究 呈现 一 种 
跨 学 科 的 态势 。 然 而 翻译 研究 最 为 突出 的 一 个 问题 就 是 定性 研究 与 定量 研究 相 脱 
节 , 理 论 研究 与 语言 转换 的 实践 相 脱 节 , 缺 乏 客观 的 量化 标准 和 评估 模式 。 建 立 基 
于 语料库 的 翻译 研究 新 方法 可 以 弥补 上 述 不 足 。 

基于 语料库 的 翻译 研究 方法 是 建立 在 以 上 各 种 方法 论 基础 之 上 的 ,是 各 种 研 
究 方法 的 整合 与 延续 。 它 以 语言 学 理论 和 科学 统计 方法 为 指导 ,以 对 双语 文本 转 
换 的 真实 语 料 为 研究 对 象 , 兼 及 翻译 活动 中 的 各 种 超 语言 因素 ,对 翻译 进行 历时 与 
共 时 的 研究 ,使 得 翻译 理论 的 研究 与 语言 转换 中 语 料 实例 重新 科学 地 结合 起 来 。 
从 本 质 上 看 ,语料库 与 翻译 研究 之 间 存 在 一 定 的 内 在 联系 。 因 为 翻译 研究 不 外 平 
涉及 文本 文化. 译 者 、 翻 译 过 程 等 语言 及 超 语言 因素 ,而 语料库 ,尤其 是 双语 对 应 / 
平行 语料库 不 仅 包括 了 语言 信息 ,也 包括 了 翻译 过 程 涉 及 的 各 种 超 语言 因素 。 

Johansson(2003) 认 为 语料库 方法 的 最 大 优势 在 于 它 可 以 将 理论 研究 与 教学 
实践 真正 结合 起 来 。 在 文 末 , 他 对 未 来 的 研究 方向 提出 了 三 点 建议 :第 一 ,多 语 语 
料 库 研究 ;第 二 ,翻译 语料库 和 学 习 者 语料库 研究 ;第 三 ,新 一 代 语法 书 和 词典 研 
编 。Laviosa(2003) 以 “语料库 与 翻译 研究 ”(Corpora and Translation Studies) 为 
题 ,提出 了 “基于 语料库 的 翻译 研究 ”corpus-based translation studies) 范 式 。 她 从 
Toury(1995) 提 出 的 “描写 翻译 研究 ”(descriptive translation studies) 与 基于 语 料 
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库 的 翻译 研究 之 间 的 联系 人手 ,指出 了 两 者 的 共性 :第 一 ,注重 从 实证 的 角度 对 真 
实 语 料 进行 直接 观察 ;第 二 ,对 语料库 文本 的 选择 并 非 基 于 某 个 固定 的 定义 ,而 是 
建立 在 共识 性 标准 和 外 部 分 类 的 基础 上 ,必要 时 采取 随机 抽样 的 方式 ;第 三 ,两 种 
方法 都 坚持 认为 从 实证 性 研究 中 得 出 的 一 般 性 结论 只 有 建立 在 对 大 量 文本 语 料 研 
究 的 基础 之 上 才能 保证 其 有 效 性 ;第 四 ,适用 于 研究 对 象 的 各 种 原则 都 是 经 过 大 量 
系统 的 研究 来 发 现 ,并 以 概率 性 规则 作为 表述 形式 。 由 此 可 见 , 翻 译 研 究 的 领域 尚 
未 最 终 划 定 , 基 于 语料库 的 翻译 研究 范式 是 在 原 有 研究 范式 的 基础 上 孕育 产生 的 ， 
其 最 大 的 优势 在 于 其 新 颖 灵活 的 研究 方法 和 关于 不 同 语言 及 翻译 现象 的 大 量 真实 
语 料 。 

按照 Toury 的 观点 ,翻译 理论 研究 与 描述 性 翻译 研究 之 间 是 一 种 互惠 的 关系 ， 
“ 换 句 话 而 言 :描述 性 翻译 研究 所 积累 的 发 现 将 有 助 于 一 系列 连贯 “法 则 ”的 制定 ， 
这 些 "法 则 ?能 够 说 明 与 翻译 活动 相关 的 各 个 变量 之 间 的 内 在 关系 ”(1995/2001， 
16)。 而 这 样 一 种 互惠 的 关系 是 建立 在 对 双语 文本 的 转换 进行 描述 的 基础 之 上 。 
他 同时 指出 纯 翻 译 研究 与 翻译 应 用 研究 之 间 是 一 种 单 向 关系 , 即 纯粹 的 翻译 研究 
只 服务 于 翻译 应 用 研究 (同上 :17-18) 。 事 实 上 翻译 理论 研究 .描述 性 翻译 研究 和 
翻译 应 用 研究 三 者 之 间 存 在 一 种 内 在 的 联系 :翻译 理论 提出 某 种 假设 或 方法 论 , 通 
过 描述 性 研究 对 其 进行 验证 ,产生 完善 的 方法 论 体系 ,然后 将 其 投入 具体 应 用 领 
域 。 在 整个 过 程 中 ,对 语 料 的 实证 性 分 析 与 描写 起 着 举足轻重 的 作用 。 基 于 语 料 
库 的 翻译 研究 是 指 将 原 语 /翻译 文本 语料库 应 用 于 对 翻译 产品 或 过 程 的 实证 性 研 
究 、 对 理论 建构 的 阐述 以 及 译员 培训 等 方面 的 学 科 分 支 , 它 的 最 大 特点 就 在 于 借助 
实证 基础 上 的 方法 和 理论 原则 ,使 用 归纳 和 演绎 的 方法 来 研究 翻译 产品 和 翻译 过 
程 。 这 种 新 研究 方法 促进 了 理论 研究 、 实 证 研究 和 应 用 研究 之 间 的 对 话 (Laviosa 
2003;Granger et. al. 2003:45)。 因 此 ,基于 语料库 的 翻译 研究 方法 使 翻译 理论 的 
模式 更 加 科学 和 完善 ,这 一 方法 的 继承 性 集中 体现 在 其 与 描述 性 翻译 研究 的 共性 
方面 :第 一 ,注重 从 实证 的 角度 对 真实 语 料 进行 直接 观察 ;第 二 ,对 语料库 文本 的 选 
择 并 非 基于 某 个 固定 的 定义 ,而 是 建立 在 共识 性 标准 和 外 部 分 类 的 基础 上 ,必要 时 
采取 随机 抽样 的 方式 ;第 三 ,两 种 方法 都 坚持 认为 从 实证 性 研究 中 得 出 的 一 般 性 结 
论 只 有 建立 在 对 大 量 文本 语 料 研究 的 基础 之 上 才能 保证 其 有 效 性 ;第 四 ,适用 于 研 
究 对 象 的 各 种 原则 都 是 经 过 大 量 系统 的 研究 来 发 现 ,并 以 概率 性 规则 作为 表述 形 
式 (同上 :49-50)。 这 样 的 研究 方法 具有 三 个 优势 :第 一 ,建立 不 同 语言 之 间 在 语义 
层次 上 的 真实 对 应 (这 里 的 “对 应 ”是 一 个 宽泛 的 概念 ); 第 二 ,对 先前 的 翻译 理论 和 
假设 进行 重新 验证 ;第 三 ,提出 新 的 假设 并 加 以 验证 。 

Olohan(2003) 指 出 语料库 语言 学 的 研究 对 象 不 是 语言 能 力 (linguistic competence) 
而 是 语言 应 用 (linguistic performance) ,所 以 基于 语料库 的 翻译 研究 就 是 以 文本 语 
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料 为 基础 ,从 直觉 出 发 产生 关于 翻译 现象 的 假设 ,并 对 这 些 假设 进行 系统 的 研究 。 
她 继而 提出 了 翻译 研究 中 语料库 研究 方法 的 理论 框架 :第 一 ,描写 研究 ,显然 语 料 
库 的 方法 是 从 真实 的 文本 语 料 出 发 ,是 对 翻译 中 语言 运用 的 描写 ;第 二 ,普遍 性 研 
究 ,基于 语料库 的 研究 方法 以 认同 /原型 的 翻译 概念 为 基本 概念 工具 ,以 多 元 系统 
理论 (the Polysystem Theory) 为 指导 研究 翻译 活动 中 的 普遍 现象 ;第 三 ,翻译 的 语 
境 化 研究 , 即 借助 翻译 文本 来 重新 构建 特定 社会 文化 环境 中 的 各 种 规范 和 限制 性 
因素 。 作 者 同时 指出 ,尽管 语料库 的 研究 方法 涉及 大 量 的 量化 数据 ,但 不 应 过 分 强 
调 这 一 方法 的 “客观 性 ”或 “科学 性 ”, 因 为 基于 语料库 的 翻译 研究 方法 同样 离 不 开 
主观 的 定性 分 析 。 


2.5 研究 方法 的 思考 


以 上 着 重 讨论 了 双语 语料库 的 发 展 、 功 用 以 及 在 语言 对 比 、 翻 译 研究 等 方面 的 
应 用 研究 。 将 语料库 应 用 于 翻译 研究 的 优势 是 不 言 而 喻 的 ,但 语料库 也 不 是 万 能 
的 。 因 此 ,我 们 在 利用 语料库 的 同时 ,也 要 注意 其 不 完善 之 处 。 

第 一 ,文本 语 料 不 可 能 穷尽 。 基 于 语料库 的 语言 分 析 和 翻译 研究 主要 是 建立 
在 对 真实 语 料 直 接 观 察 基础 之 上 的 归纳 性 研究 ,那么 多 大 规模 的 语料库 才能 称 得 
上 是 具有 代表 性 ? 才能 使 所 得 出 的 结论 更 具有 普遍 性 的 特征 ? 

第 二 ,语料库 (尤其 是 对 应 语料库 ) 的 选材 过 程 通常 是 以 建 库 者 的 母语 语言 系 
统 为 出 发 点 (Granger et. al. :47) ,那么 选材 的 标准 难免 会 受到 本 族 语 价值 体系 的 
干扰 ,使 得 对 文本 的 选择 带 有 一 定 的 主观 性 和 偶然 性 ,应 当 采 取 什 么 样 的 标准 来 最 
大 限度 地 摆脱 这 种 影响 ? 

第 三 ,原创 语言 作品 以 及 翻译 作品 的 质量 应 当 以 什么 样 的 标准 来 衡量 ? 

第 四 ,双语 文本 的 对 应 问题 。 上 文 已 经 提 到 对 应 /平行 语料库 相对 而 言 与 翻译 
研究 的 关系 最 为 紧密 ,双语 文本 间 的 对 应 除了 词 级 , 句 级 , 段 级 或 篇 章 级 等 形式 对 
应 之 外 ,语义 对 应 方式 的 研究 是 否 应 当 作 为 此 项 翻译 研究 的 重点 呢 ? 因为 对 应 语 
料 库 的 最 大 特征 就 在 于 双语 的 平行 对 应 ,使 我 们 对 两 种 不 同 语言 之 间 的 “一 一 对 
应 "有 了 重新 的 认识 ,这 一 点 正好 应 验 了 雅 柯 布 森 (1959) 的 观点 :“ 语 言 之 间 真 正 的 
区 别 不 在 于 说 话 者 可 以 或 者 不 可 以 表达 什么 ,而 在 于 说 话 者 必须 或 者 决 不 能 表达 
什么 ”( 钱 军 等 译 2001:266) 。 

第 五 ,目前 世界 上 印 欧 语系 之 外 语言 (如 汉语 .日语 .朝鲜 语 、 马 来 语 . 泰 语 等 ) 
的 基于 双语 库 的 对 比分 析 和 翻译 研究 成 果 都 还 比较 少 ,有 待 于 我 们 努力 。 拿 汉语 
来 说 ,英汉 两 种 语言 同 为 世界 上 的 两 大 语种 ,分 属 不 同 的 语系 ,基于 英汉 / 汉 英 平行 
语料库 的 研究 一 定 会 深化 我 们 对 许多 语言 问题 的 认识 。 


第 3 章 


语料库 翻译 学 的 发 展 历程 


方法 论 的 突破 ,合理 的 假设 和 求证 ,研究 的 融通 ,这 三 者 是 语料库 翻译 学 发 展 
的 主要 脉络 。 本 章 简要 回顾 近 15 年 来 新 兴 的 语料库 翻译 学 的 发 展 历程 ,重点 从 翻 
译 共性 ,翻译 文体 、 翻 译 过 程 , 应 用 研究 (包括 翻译 教学 ) 等 方面 评论 语料库 翻译 学 
的 新 视点 和 新 闻 释 。 


语料库 应 用 于 翻译 研究 历史 不 长 。20 多 年 前 , Vanderauwera(1985) 以 五 部 荷 
兰 语 小 说 的 英 译本 为 语 料 , 讨 论 了 翻译 语言 表现 出 的 语 际 简化 . 显 化 和 范 化 ,初步 
具备 了 语料库 翻译 共性 研究 的 雏形 。Gellerstam(1986) 对 比 了 瑞典 语 翻译 和 非 翻 
译 小 说 文本 ,从 语 内 类 比 角度 讨论 了 “翻译 体 ”(translationese) 的 语言 特征 。 这 些 
研究 抛 开 了 翻译 研究 中 传统 的 “对 等 ”理念 ,开始 关注 翻译 转换 中 语言 之 间 的 相互 
作用 带 来 的 语言 变化 以 及 促成 此 类 变化 的 语言 内 、 外 因素 ,开辟 了 翻译 研究 新 视 
角 。 同 时 这 一 方法 也 被 应 用 于 语言 对 比 等 研究 领域 。1993 年 Baker 发 表 了 “ 语 料 
库 语言 学 与 翻译 研究 :启示 与 应 用 ”一 文 ,她 在 文中 提出 :利用 大 型 的 原文 加 译文 的 
语料库 ,加 上 语料库 研究 方法 的 探讨 ,将 使 翻译 研究 者 得 以 揭示 翻译 文本 作为 沟通 
媒介 的 本 质 (1993:243) 。 此 文 可 视 为 “基于 语料库 的 翻译 研究 ”或 日 语料库 翻译 
2” (Corpus-based Translation Studies) 研 究 途径 的 开通 。15 年 来 ,各 国学 者 进行 
了 大 量 的 理论 与 实证 探讨 ,使 这 一 研究 途径 逐步 发 展 为 一 种 新 研究 范式 ( 王 克 非 
2006) 。 本 章 勾 勒 15 年 来 这 一 领域 的 发 展 ,在 此 基础 上 讨论 该 领域 的 前 景 以 及 带 
给 未 来 翻译 研究 的 启示 。 


3.2 ”语料库 翻译 学 的 主要 成 就 


语料库 翻译 学 的 开展 以 双语 的 计算 机 语料库 为 前 提 。20 世纪 90 年 代 以 来 ， 
各 种 双语 语料库 在 各 国 建立 起 来 。 双 语 语料库 主要 有 翻译 语料库 (translational 
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corpus) :对 应 语料库 (parallel corpus) 和 类 比 语 料 库 (comparable corpus) 三 种 ,各 
有 其 特点 和 用 途 ( 王 克 非 等 2004b)。 因 此 对 于 语料库 翻译 学 的 发 展 来 说 ,有 两 大 
关键 点 :一 是 双语 库 的 研制 , 它 是 技术 手段 ,是 基础 设施 ,也 体现 研制 者 的 研究 目 
的 ;其 加 工程 度 影 响 研究 课题 的 选择 。 二 是 研究 切 人 点 , 即 利用 双语 库 能 给 翻译 研 
究 带 来 什么 新 发 现 新 解释 或 提出 什么 新 问题 。 限 于 篇 幅 , 本 章 主 要 谈 后 一 点 , 即 语 
料 库 翻 译 学 的 研究 课题 。 


3.2.1 翻译 共性 研究 (translation universal) 


Chesterman(2004a:33) 指 出 ， 一 门 科 学 只 有 通过 在 单个 个 案 之 间 寻 找 其 相似 
性 并 从 中 加 以 归纳 ,才能 达到 对 未 来 研究 或 尚未 研究 个 案 的 预测 ,从 而 取得 进步 。” 
翻译 共性 即 语料库 翻译 学 试图 探寻 的 翻译 语言 整体 特征 。 

翻译 共性 是 指 翻译 语言 作为 一 种 客观 存在 的 语言 变 体 , 相 对 于 源 语 语言 或 目 
标语 原创 语言 在 整体 上 表现 出 来 的 一 些 规律 性 语言 特征 。Chesterman (2004a， 
2004b) 将 其 划分 为 源 语 型 共性 (S-universals) 和 目标 语 型 共性 (T-universals) 两 大 
类 ,前 者 是 基于 源 语文 本 与 译文 之 间 的 语 际 对 比 关系 ,关注 译 者 对 源 语文 本 的 处 理 
方式 ;后 者 是 关于 目标 语 中 翻译 文本 与 非 翻 译文 本 之 间 的 语 内 类 比 关系 ,重点 放 在 
译 者 对 目标 语 语言 的 处 理 方式 上 。Baker(1993: 243) 所 谓 的 “翻译 普遍 特征 ” 
《universal features of translation) 即 属 后 一 类 ,她 将 其 定义 为 “翻译 文本 而 不 是 原 话语 
中 出 现 的 典型 语言 特征 ,并 且 这 些 特 征 不 是 特定 语言 系统 干扰 的 结果 ”。 柯 飞 (2005) 
所 提出 的 “翻译 共性 ” 则 属 前 者 ,是 指 “ 译 文中 呈现 的 有 别 于 原文 的 一 些 典型 的 、 跨 语 
言 的 ,有 一 定 普遍 性 的 特征 ”。 近 年 来 对 翻译 共性 的 讨论 包括 显 化 (explicitation) 、 
隐 化 (implicitation) ,简化 (simplification) 、 范 化 (normalization/conventionalization) 、 
集中 化 (convergence) ,整齐 化 (levelling out) ,非典 型 搭配 (untypical collocations) 、 
干扰 (interference) ,独特 项 (unique items) 等 ,方法 上 则 是 从 具体 语言 因素 人 手 , 采 
用 语 际 、 语 内 或 两 者 结合 的 对 比 模式 ,以 概率 和 统计 为 手段 ,尝试 从 语言 之 间 相 互 
作用 在 语言 层面 的 表现 探索 翻译 语言 的 规律 性 特征 ,并 从 语言 内 、 外 加 以 解释 。 

根据 Baker(1998a) ,翻译 共性 研究 的 目的 在 于 识别 翻译 文本 的 典型 语言 特征 ， 
这 样 不 仅 可 以 揭示 “第 三 类 语 码 ”的 本 质 ,更 重要 的 是 能 认识 影响 翻译 行为 以 及 隐 
藏 于 此 类 独特 语言 形式 之 下 的 各 种 具体 的 制约 因素 .压力 和 动机 ,从 而 达到 对 翻译 
现象 的 深层 解释 。 不 同 语种 中 现 有 关于 翻译 共性 的 实证 研究 结果 不 尽 一 致 , 既 有 
对 现 有 假设 的 证 明 ,也 有 质疑 。 吴 昂 、 黄 立波 (2006:300) 曾 指出 ,产生 质疑 的 原因 
有 两 个 :一 是 对 研究 对 象 的 界定 ,二 是 对 各 种 变量 的 关注 与 控制 。 以 译 者 因素 为 
例 ,一 方面 可 就 不 同 译 者 对 同一 原作 或 同一 作者 作品 的 翻译 加 以 考察 ,这 种 研究 属 
于 译 者 文体 或 翻译 文体 学 范畴 。 另 一 方面 则 是 译 和 人 还 是 译 出 的 问题 ,即将 外 语文 
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本 翻译 成 母语 ,还 是 将 母语 译 成 其 他 语言 ,同时 涉及 翻译 方向 因素 。 目 前 , 英 译 汉 
文本 大 多 属于 译 和 人 , 即 由 以 汉语 为 母语 的 译 者 完成 ,而 汉 译 英文 本 中 的 情况 可 以 分 
为 汉语 母语 译 者 、 汉 英 合 作 译 者 和 英语 母语 译 者 三 类 ,后 两 类 所 占 比 例 较 小 ,这 也 
是 影响 语 料 平衡 性 的 一 个 因素 。 对 各 类 翻译 文本 中 表现 出 的 语言 共性 的 探究 有 助 
于 我 们 进一步 认识 翻译 的 本 质 。Toury(2004) 提 出 ,对 翻译 共性 的 研究 既 不 应 过 
分 具体 化 ,也 不 可 层次 过 高 ,而 应 当 采 用 概率 思维 方式 对 其 加 以 认识 ,并 以 条 件 式 
表述 方法 加 以 描写 和 解释 ;翻译 共性 研究 并 非 一 个 存在 与 否 的 问题 ,而 是 一 个 解释 
力 问题 , 即 如 何 借助 各 种 概念 工具 对 翻译 现象 进行 更 好 的 解释 。 翻 译 共性 研究 的 
最 终 目 标 是 探究 各 类 翻译 活动 的 一 般 规 律 ,具体 语 对 (language pairs) 中 的 共性 研 
究 都 是 一 般 共 性 研究 的 组 成 部 分 。 就 此 Eskola(2004) 做 了 一 个 非常 形象 的 类 比 ， 
她 说 翻译 共性 研究 就 像 一 个 拼图 游戏 ,有 关 每 一 块 拼 板 的 使 用 信息 都 是 完成 整个 
游戏 所 需 信息 的 一 个 部 分 。 同 样 , 每 一 个 案 研究 都 会 提供 特定 语 对 和 文本 类 型 中 
关于 共性 的 局 部 信息 ,这 些 对 认识 总 体 共 性 都 是 绝对 必要 的 。 


3.2.2 译 者 风格 研究 (translator's style) 


对 翻译 文体 的 讨论 早已 有 之 ,Venuti(1995) 曾 用 “隐身 ”(invisibility) 一 词 来 描 
述 当代 英美 文化 中 译 者 的 行为 方式 及 由 此 而 造成 的 社会 地 位 ,他 认为 译 者 为 迎合 
读者 一 味 采 取 归 化 式 的 “流畅 ”fluency) 译 法 ,使 译文 呈现 “透明 ”(transparency) 状 
态 。Hermans(1996:27) 提 出 ,翻译 叙事 话语 (translated narrative discourse) ZE X 
本 中 表现 出 的 声音 不 止 一 种 ,其 话语 呈现 (discursive presence) 方 式 也 不 止 一 种 ,他 
将 叙事 话语 中 包含 的 “第 二 位 ”声音 称 为 译 者 的 声音 (translator”s voice) ,以 此 作为 
译 者 话语 呈现 的 表征 。Hermans(2002:11) 指 出 ,译作 当中 译 者 异 质 声音 的 痕迹 随处 
可 循 ,译作 绝 非 是 对 原作 的 透明 再 现 ,而 是 具有 多 重 、 分 散 . 混 杂 和 复 调 (polyphony) 
性 质 的 双重 文本 , 旁 注 .脚注 ,括号 说 明 以 及 序言 等 准 文本 形式 无 不 表明 两 种 不 协 
调 的 声音 共存 于 译作 中 ,因此 以 “透明 ”来 评价 译作 有 些 过 于 简单 。 这 些 研究 主要 
是 从 翻译 策略 及 翻译 的 社会 表现 形式 探讨 译 者 特有 的 存在 方式 ,是 从 语言 外 部 来 
观察 翻译 整体 表现 出 的 特征 。 语 料 库 翻译 研究 模式 则 是 将 译 者 以 诸 言 和 非 语言 形 
式 所 表现 出 的 风格 均 作为 研究 对 象 ,扩大 了 翻译 文体 的 范围 

Baker(2000:245) 将 文体 定义 为 “ 留 在 文本 中 的 一 系列 语言 及 非 语言 的 个 性 特 
征 ”, 翻译 文体 包括 译 者 的 选材 .惯用 的 具体 策略 ,包括 前 言 .后 记 、 脚 注 , 文 中 词汇 
注释 等 ,尤为 重要 的 是 个 性 表达 方式 , 即 典型 的 语言 运用 习惯 。 由 此 可 见 , Baker 
所 谓 的 翻译 文体 是 一 个 宽泛 的 概念 ,而 且 这 些 特征 是 译 者 在 翻译 过 程 中 的 无 意识 
产物 ,并 且 在 一 定时 间 范 围 内 保持 相对 稳定 。Baker 利用 类 符 - 形 符 比 .平均 句 长 以 
及 词 项 say 的 使 用 ,对 比 了 Peter Bush 与 Peter Clark 两 位 译 者 的 译文 后 得 出 结 
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论 : 既 然 从 理论 上 识别 某 个 文学 译 者 的 文体 是 可 能 的 ,就 有 可 能 借助 此 类 描写 来 描 
绘 该 译 者 选择 再 现 的 世界 ,帮助 研究 者 将 语言 习惯 与 译 者 的 社会 文化 处 境 ( 包 括 文 
化 之 间 的 关系 、 预 期 读者 等 ) 结 合 起 来 。Olohan(2004:153-167) 通 过 “个 体 译 者 的 
缩 略 词 模式 调查 ”和 “应 用 关键 词 分 析 探 究 译 者 的 词汇 选择 ”两 个 个 案 介绍 了 译 者 
文体 研究 的 具体 操作 。Olohan 同时 指出 ,影响 译 者 文体 的 因素 包括 文化 中 介 的 需 
要 ,读者 期 望 意 识 形态 以 及 编辑 与 修改 等 。Malmkjsaer(2004) 以 H. W. Dulcken 
对 Hans Christian Andersen 作品 的 英 译 为 例 对 译 者 文体 作 了 进一步 探索 ,初步 提 
出 了 “翻译 文体 学 ”(translation stylistics) 这 一 概念 ,主要 关注 在 源 语文 本 既定 条 件 
下 , 译 者 为 什么 会 以 特定 的 方式 来 塑造 译文 ,对 这 些 现象 的 解释 除 考虑 语言 因素 
外 , 亦 可 从 语言 外 因素 ,如 翻译 规范 、 目 标语 文本 的 目的 等 人 手 。 但 在 此 基础 上 的 
大 规模 研究 并 未 展开 ,研究 所 选用 语 料 规模 较 小 ,而 且 仅 限于 文学 翻译 。 


3.2.3 翻译 过 程 研究 


翻译 过 程 是 语料库 翻译 学 关注 的 另 一 方面 。 翻 译 过 程 研究 的 对 象 即 译 者 大 脑 
( 常 被 称 为 “黑匣子 ”) 中 的 转换 活动 。 由 于 对 此 种 活动 无 法 直接 进行 观察 ,一 直 以 
来 研究 者 仅 凭借 源 语 与 目标 语文 本 的 对 比 ,以 推测 的 方式 归纳 译 者 在 翻译 过 程 中 
采取 的 特定 策略 。20 世纪 80 年 代 以 来 有声 思 维 法 (think-aloud protocol) 的 应 用 
使 翻译 过 程 的 研究 进入 一 个 新 的 阶段 。 有 声 思维 法 作为 一 种 文本 数据 采集 方法 本 
身 就 具有 语料库 研究 的 雏形 , 即 透 过 真实 的 翻译 文本 来 研究 翻译 过 程 。Shlesinger 
(1998) 探 讨 了 语料库 辅助 的 口译 研究 作为 基于 语料库 的 翻译 研究 分 支 的 可 行 性 ， 
将 口译 研究 纳 人 语料库 翻译 研究 的 视野 。Englund-Dimitrova(2005) 借 助 有 声 思 
维 法 和 计算 机 记录 书写 过 程 等 手段 ,对 俄语 -瑞典 语 翻译 中 转折 连词 在 译文 中 显 化 
与 否 进行 了 考察 。 此 研究 的 独特 之 处 在 于 将 记录 翻译 过 程 的 元 文本 (meta-text) 与 
翻译 文本 本 身 结合 起 来 考察 翻译 过 程 。 传 统 翻译 过 程 研究 的 局 限 在 于 仅 从 文本 中 
推测 翻译 过 程 ,而 且 语 料 规模 小 , 语 料 类 型 单一 ,大 规模 翻译 过 程 语料库 的 建立 可 
以 帮助 翻译 研究 者 更 为 直观 的 分 析 以 元 文本 形式 表现 出 的 翻译 过 程 。 


3.2.4 翻译 应 用 研究 


双语 对 应 语料库 和 类 比 语料库 的 应 用 研究 主要 是 在 译 者 培训 、 翻 译 教学 方面 
以 及 相关 软件 的 开发 。 代 表 性 的 研究 包括 Zanettin(1998) , Bowker(1998) , Monzó 
(2003) ,Pearson(2003) 4%, Bernardini 曾 指出 ,将 平行 语 料 检索 应 用 于 翻译 教学 可 
以 培养 翻译 专业 学 生 的 翻译 “意识 ”“ 反 射 " 和 “应 变 ”( 王 克 非 等 2004b) 。 就 学 生 
翻译 意识 的 培养 ,Chesterman(1997:157-158) 有 三 个 建议 :第 一 ,为 学 生 提供 各 种 
类 型 的 翻译 文本 ,将 源 语文 本 与 翻译 文本 加 以 比较 ,来 认识 源 语 一 目标 语 的 各 种 关 
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系 ;第 二 ,将 某 一 源 语文 本 以 不 同 的 方式 进行 翻译 ,来 认识 源 语 一 目标 语 关系 在 具 
体 实 践 中 的 变化 ;第 三 ,对 翻译 个 案 中 不 恰当 的 源 语 一 目标 语 关 系 进 行 研究 ,尝试 
提出 新 策略 。 这 些 方法 旨 在 从 翻译 产品 人 手 ,通过 观摩 对 比 、 分 析 、 借 鉴 的 方式 发 
挥 学 生 的 主动 性 ,在 评估 他 人 译作 和 自我 实践 基础 上 提高 学 生 的 翻译 技能 ,翻译 语 
料 库 正 是 实现 这 些 设想 的 较 佳 工具 。Zanettin(1998) 展 示 了 如 何 将 小 型 普通 或 专 
门 双 语 语 料 库 应 用 于 学 生 自 主 课堂 教学 ,以 加 强 学 生 对 源 语文 本 的 理解 ,提高 他 们 
目标 语 表达 能 力 。Bowker(1998) 选 取 了 两 组 翻译 文本 ,一 组 翻译 采用 传统 的 练习 
方法 , 即 以 词典 等 工具 书 为 参考 , 另 一 组 以 一 个 专门 单 语 语料库 作为 辅助 手段 ,两 
者 对 比 表 明 :后 者 在 理解 主题 .选择 术语 、 习 语 表 达 等 方面 明显 优 于 前 者 。Monz6 
《2003) 指 出 ,让 翻译 学 习 者 认识 翻译 的 最 好 办 法 就 是 让 他 们 置身 翻译 其 中 ,借助 双 
语 对 应 或 类 比 语 料 ,不 仅 能 让 学 生 直 接 观 察 源 语 语言 系统 的 规则 ,也 可 看 到 翻译 文 
本 自身 的 特征 ,建立 对 翻译 转换 的 感性 认识 。 王 克 非 (2007) 通 过 双语 对 应 语 料 呈 
现实 验 ,证 明 学 生 能 够 根据 自己 的 观察 ,归纳 和 总 结 翻译 技巧 ,及 时 评估 或 反思 自 
己 的 翻译 行为 ,有 助 于 翻译 技巧 的 掌握 。 

从 形式 上 讲 , 应 用 型 语料库 主要 分 对 应 语料库 和 类 比 语料库 两 大 类 。 前 者 主 
要 关注 语 际 转换 中 的 翻译 现象 ,还 可 用 来 提取 双语 词汇 , 供 学 习 者 借鉴 他 人 的 翻译 
策略 ;后 者 中 的 目标 语 非 翻 译文 本 发 挥 着 参照 功能 , 供 学 习 者 查找 常用 搭配 ,分 辩 
特定 文本 类 型 中 的 常规 表达 方式 ,为 解决 特定 问题 的 办 法 提供 依据 ;从 语 料 内 容 上 
应 用 型 语料库 可 分 为 普通 型 .专门 型 (提取 术语 和 双语 词汇 ) 和 学 习 型 三 类 。 普 通 
型 语料库 适用 于 各 类 翻译 翻译 者 ,专门 型 语料库 ,如 法 律 \ 经 贸 等 可 为 专业 翻译 人 
员 提 供 帮 助 ,学 习 型 翻译 语料库 以 学 习 者 自己 的 翻译 文本 为 语 料 , 可 用 于 翻译 错误 
分 析 等 方面 。Olohan(2004) 指 出 ,还 可 利用 网 络 作为 翻译 实践 中 的 参照 库 , 在 线 语 
料 库 (online corpus) 及 翻译 记忆 系统 (translation memory systems) 均 可 充当 对 应 
语料库 的 角色 。 语 料 库 翻 译 途 径 具 有 很 多 优势 ,但 同时 也 有 一 定局 限 。Olohan 特 
别 指出 ,不 能 因为 语料库 的 方便 ,快捷 、 信 息 量 大 等 特点 就 过 分 夸大 其 在 实践 与 应 
用 方面 的 作用 ,因为 语料库 毕竟 是 静态 的 文本 ,其 中 受 时 间 限 制 的 模式 化 策略 会 抹 
杀 译 者 的 创造 性 。 


3.3 语料库 翻译 学 带 来 的 启示 与 思考 


纵 观 语料库 翻译 学 15 年 的 发 展 历程 ,可 获得 如 下 一 些 启示 : 

第 一 ,一 种 新 研究 范式 的 建立 往往 以 方法 论 和 学 科 基 质 的 建立 为 基础 ,研究 方 
法 的 改进 必定 会 促进 研究 范式 的 发 展 与 更 蔡 。 语 料 库 翻译 学 一 改 先前 翻译 研究 只 
注重 特定 语言 单位 转换 的 传统 ,从 整体 考察 大 规模 文本 ,从 微观 人 手 描写 双语 转换 
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的 宏观 特征 ,并 从 语言 . 认 知 ,社会 文化 等 角度 加 以 解释 。 可 以 说 ,语料库 翻译 学 的 
研究 方法 是 各 种 传统 翻译 研究 方法 的 整合 与 延续 ,也 是 建立 新 研究 范式 的 尝试 。 
语料库 翻译 研究 本 身 是 一 种 研究 途径 ,其 中 涉及 的 假设 ,发现 . 方 法 与 原则 都 属于 
方法 论 的 范畴 ,加 上 研究 者 团体 及 系统 的 思想 阐述 , 就 成 为 一 种 研究 范式 。 
Lavisoa(1998a;2002:22) 指 出 , 正 是 众多 研究 者 的 多 样 化 实证 研究 与 理论 阐述 使 
得 语料库 翻译 研究 迅速 发 展 ,逐步 由 一 种 方法 论 发 展 成 为 一 种 连贯 ,综合 ,丰富 的 
范式 ,应 用 于 对 翻译 理论 ,描写 以 及 实践 等 一 系列 问题 的 探讨 。 

第 二 ,善于 提出 合理 假设 ,才能 开辟 新 研究 课题 。 建 立 在 直觉 基础 上 的 假设 是 
系统 研究 的 出 发 点 。 实 证 研究 以 假设 为 出 发 点 ,以 数据 统计 为 基础 ,数据 是 研究 对 
象 的 一 部 分 ,数据 以 外 的 因素 构成 了 研究 对 象 的 另 一 部 分 ,前 者 属于 客观 的 表象 ， 
后 者 较为 隐蔽 .主观 化 。Laviosa(2002:2) 指 出 ,语料库 翻译 研究 的 本 质 就 是 对 假 
设 进行 检验 ,具体 表现 为 以 下 步 又 :1) 提 出 假设 ;2) 建 立 研究 目标 并 对 假设 进行 验 
证 ;3) 描 写 和 分 析 数 据 ;4) 对 发 现 进行 理论 阐述 ;5) 将 假设 精确 化 ;6) 在 此 基础 上 为 
将 来 的 研究 提出 新 的 假设 ,在 重复 运作 的 基础 上 对 理论 进行 修正 和 完善 并 建立 初 
步 的 方法 论 体系 。 以 翻译 共性 研究 为 例 ,首先 是 通过 语料库 对 翻译 语言 模式 进行 
描写 和 归纳 ,然后 从 语言 内 部 以 及 跨 语 言 的 角度 分 析 各 种 翻译 模式 出 现 的 原因 ,在 
此 基础 上 ,从 语言 外 部 ,如 认 知 ,社会 等 角度 探究 各 种 翻译 模式 的 根源 。 

第 三 ,翻译 研究 中 的 “融通 ”(consilience) 趋 势 。 翻 译 的 本 质 是 本 族 语 在 与 异域 
语言 交流 与 相互 作用 过 程 中 的 “扬弃 ”, 这 一 过 程 既 有 碰撞 与 冲突 ,也 有 相互 协调 与 
妥协 。 对 翻译 本 质 的 认识 是 一 个 不 断 深入 的 过 程 ,认识 的 途径 既 有 语言 内 的 也 有 
语言 外 的 ,而 总 的 趋势 是 “融通 ”D, 即 “各 种 知识 的 统一 ”。Chesterman(2005: 25) 
指出 ,从 融通 的 观点 看 ,现代 翻译 研究 声称 自己 是 尝试 以 跨 界 的 方式 探寻 对 文本 、 
社会 和 文化 之 间 相 互 关系 的 深入 认识 ,达到 融通 的 一 条 途径 就 是 将 翻译 研究 纳 人 
模 因 学 (memetics) ,因为 模 因 (memes) 是 文化 尤其 是 文化 转换 的 因素 。 作 为 实证 
研究 ,语料库 翻译 研究 是 在 描写 基础 上 解释 和 预测 ,不 仅 涉 及 语料库 语言 学 和 翻译 
研究 本 身 , 还 涉及 社会 ,文化 . 认 知 等 各 种 语言 外 途径 ,各 种 途径 的 融通 是 翻译 研究 
的 必然 趋势 。 


®© Chesterman 的 这 一 概念 来 自己 O. Wilson. 1998. Consilience: The Unity of Knowledge. 
New York: Knopf, 


第 4 章 
语料库 翻译 学 的 研究 范式 


本 章 从 区 别 性 特征 的 角度 论证 了 语料库 翻译 学 是 翻译 学 的 一 种 新 的 研究 范 
式 ,而 不 是 其 他 范式 的 分 支 或 仅仅 是 一 种 方法 。 在 此 基础 上 ,提出 了 语料库 翻译 学 
的 范式 体系 ,包括 三 个 研究 层面 :理论 研究 .描写 研究 与 应 用 研究 。 本 章 还 讨论 了 
语料库 翻译 学 范式 的 当下 所 面临 的 两 个 问题 : 比较 中 立项 问题 与 逆 证 的 方法 论 
问题 。 


1995 年 ,翻译 研究 中 语料库 路 向 的 主要 推动 者 Mona Baker 提出 “翻译 学 理论 
研究 的 重心 需要 转向 , 即 从 原文 与 译文 的 比较 或 A 语言 与 B 语 言 的 比较 转向 文本 
生成 本 身 与 翻译 的 比较 ”(Baker 1995:233)。 这 可 以 看 作 翻 译 研究 中 语料库 路 向 
的 正式 宣言 。1996 年 , Baker (1996: 175) 又 提出 了 “基于 语料库 的 翻译 研究 ” 
(corpus-based translation studies) 。1998 年 , Baker 的 学 生 Laviosa(1998:1) 正 式 
将 翻译 研究 中 的 语料库 路 向 认定 为 翻译 研究 的 “一 种 新 范式 ”(a new paradigm). 
同年 , Tymoczko(1998:1) 将 翻译 研究 中 的 语料库 路 向 正式 命名 为 “语料库 翻译 研 
究 ”(corpus translation studies, 简 称 CTS) 。 在 国内 ,翻译 研究 中 的 语料库 路 向 也 
逐渐 得 到 了 认可 和 肯定 。2006 年 , 王 克 非 首次 正式 提出 了 “语料库 翻译 学 ,并 也 
将 其 确定 为 翻译 学 的 新 研究 范式 (2006:8)。 这 说 明 , 经 过 十 多 年 的 发 展 ,许多 学 者 
认为 翻译 研究 中 的 语料库 路 向 已 取得 了 质 的 突破 ,成 为 了 翻译 学 的 新 生长 点 。 同 
时 ,也 有 学 者 提出 了 不 同 的 观点 。 刘 康 龙 、 穆 雷 (2006:61) 认 为 语料库 是 描写 翻译 
学 的 一 个 分 支 。Olohan(2004:3) 认 为 翻译 研究 中 语料库 的 使 用 应 看 作 是 一 种 方 
法 ,而 不 是 一 种 范式 。 本 章 将 从 理论 上 讨论 语料库 翻译 学 的 定位 ,是 翻译 学 的 一 种 
新 的 方法 还 是 一 种 新 的 研究 范式 。 我 们 认为 ,这 是 翻译 研究 中 语料库 路 向 的 重大 
理论 问题 。 此 外 还 将 探讨 ,如 果 翻 译 研究 中 的 语料库 路 向 是 翻译 学 的 新 范式 ,那么 
其 范式 体系 又 是 什么 ? 
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4.2 语料库 翻译 学 的 范式 理据 


经 过 80 年 代 的 文化 转向 和 90 年 代 的 解构 主义 之 后 ,翻译 学 可 谓 陷 人 了 一 种 
危机 之 中 。 一 方面 在 本 体 论 上 面临 着 被 瓦解 的 风险 , 消 强 在 文化 研究 之 中 (如 俊 
2002) 。 另 一 方面 在 方法 论 上 难以 推陈出新 ,未 形成 新 的 研究 领域 和 概念 范畴 。 我 
们 认为 ,翻译 学 的 学 科 变 化 首先 来 自 于 翻译 思想 的 变化 。 刘 密 庆 (2005:285) 认 为 ， 
当代 西方 译 论 思想 出 现 了 六 种 倾向 ,从 而 表现 出 与 西方 传统 译 论 的 玻 离 :1) 在 语义 
内 容 与 表达 形式 这 一 对 矛盾 中 ,明显 向 表达 形式 倾斜 ;2) 在 交流 内 容 与 交流 目的 这 
一 对 矛盾 中 ,明显 向 交流 目的 倾斜 ;3) 在 交流 意向 与 交流 效果 这 一 对 矛盾 中 ,明显 
向 交流 效果 倾斜 ;4) 在 异化 与 归 化 这 一 对 矛盾 中 ,明显 向 归 化 倾斜 ;5) 在 作者 功能 
与 译 者 功能 这 一 对 矛盾 中 ,明显 向 译 者 倾斜 ;6) 在 原文 取向 与 译文 取向 这 一 对 矛盾 
中 ,明显 向 译文 的 流利 倾斜 。 由 此 可 以 看 出 ,当代 西方 翻译 思想 的 倾向 是 形式 、 目 
的 ,效果 , 归 化 , 译 者 与 译文 。 也 就 是 说 更 加 重视 翻译 的 经 验 性 研究 , 即 翻 译本 身 的 
研究 ,而 不 寻求 与 原文 的 比较 。 这 也 是 描写 翻译 学 (DTS) 的 思想 源头 。 

其 次 ,具体 的 翻译 研究 路 向 也 发 生 了 变化 。Baker(1993) 认 为 ,翻译 研究 中 语 
料 库 路 向 的 出 现 主要 有 三 方面 的 原因 :一 是 新 的 视角 的 出 现 导致 了 原文 地 位 的 削 
弱 。70 年 代 末 兴起 的 多 元 系统 理论 对 源 语文 本 的 地 位 产生 了 深远 的 影响 。 该 派 
宣称 翻译 只 属于 一 个 文本 系统 :目的 语文 本 系统 。 二 是 20 世纪 70 年 代 末 开始 ,以 
原文 为 导向 的 对 等 概念 逐渐 让 位 于 以 目的 语系 统 为 起 点 的 概念 。 翻 译 研究 中 源 语 
文本 与 目的 语文 本 之 间 关系 的 语义 观 的 衰落 导致 了 翻译 研究 中 新 的 意义 观 出 现 。 
意义 从 概念 转向 了 情景 ,进而 转向 了 使 用 ,从 而 推动 了 翻译 研究 中 的 描写 倾向 , 特 
别 是 语料库 研究 。 以 目的 语系 统 为 起 点 的 概念 中 最 重要 的 就 是 Toury(1978， 
1980) 提 出 的 规范 概念 。 规 范 是 个 描述 分 析 的 范畴 。 规 范 概念 出 现 后 ,翻译 研究 的 
首要 对 象 不 再 是 单个 的 翻译 文本 ,而 是 转向 了 连贯 的 翻译 文本 语料库 。 三 是 描写 
翻译 学 的 兴起 。70 年 代 开 始 ,就 有 学 者 提出 了 对 翻译 研究 中 的 内 省 法 的 不 满 ,如 
Holmes(1972/1988:101)、Newman(1980:64)。 他 们 认为 出 路 就 是 去 观察 翻译 的 
实例 ,然后 在 此 基础 上 进行 归纳 与 概括 。 但 我 们 认为 ,描写 翻译 学 在 研究 范围 上 过 
于 注重 文学 翻译 ,很 难 对 占 实际 翻译 中 比例 最 大 的 实用 翻译 做 出 合理 的 解释 ,其 在 
研究 目标 上 提出 的 翻译 学 “定律 ?也 章 到 质疑 (Tymoczko1998:653; Hermans 1999; 
92; Venuti 1995:361-363), 认 为 其 过 于 规约 性 。 同 时 ,又 未 提出 具体 可 行 的 研究 方 
法 ,所 以 难以 发 展 为 真正 的 “普通 翻译 学 ”。 在 此 历史 背景 下 ,90 年 代 中 期 以 来 , 语 
料 库 翻 译 学 迅速 发 展 起 来 。 语 料 库 翻译 学 影响 了 翻译 学 的 方法 论 基础 和 研究 对 
象 ,从 而 实现 了 对 翻译 研究 领域 的 重建 。Tymoczko(1998:652-653) 指 出 :“ 语 料 库 
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翻译 研究 出 现在 翻译 研究 发 展 的 关键 时 刻 一 一 整个 翻译 研究 中 的 各 种 论争 都 在 语 
料 库 翻 译 研究 中 得 到 了 反映 ”。 

语料库 翻译 学 借鉴 了 语料库 语言 学 和 翻译 学 中 其 他 范式 的 成 果 , 但 这 并 不 意 
味 着 语料库 翻译 学 仅仅 是 语料库 语言 学 和 翻译 学 中 其 他 范式 的 延伸 。 我 们 认为 ， 
语料库 翻译 学 有 自己 的 特殊 的 学 科 地 位 和 区 别 性 特征 。 下 面 就 讨论 一 下 语料库 翻 
译 学 与 和 它 关 系 最 密切 的 语料库 语言 学 、 翻 译 研究 中 传统 的 语言 学 范式 、 翻 译 的 描 
写 范式 之 间 的 区 别 。 

首先 ,语料库 翻译 学 不 同 于 语料库 语言 学 。 语 料 库 翻 译 学 借鉴 了 语料库 语言 
学 的 基本 理念 和 基本 的 研究 方法 。 语 料 库 语 言 学 的 重要 发 现 之 一 就 是 语言 使 用 中 
语法 和 词汇 其 实 是 不 能 分 开 的 ,必须 整合 描写 。 语 料 库 翻 译 学 不 赞同 将 词汇 与 语 
法 分 开 的 做 法 。 语 料 库 翻译 学 使 用 的 工具 基本 是 依赖 于 语料库 语言 学 的 研究 工具 
和 软件 。 但 同时 ,语料库 翻译 学 又 有 自身 的 特点 。 王 克 非 (2006:8-9) 认 为 ,主要 区 
别 为 ;一 是 所 据 语料库 不 同 。 语 料 库 语言 学 依据 单 语 语料库 即 可 ,语料库 翻译 学 一 
般 要 依靠 双语 语料库 ,主要 是 翻译 语料库 、 对 应 语料库 和 类 比 语料库 。 二 是 标注 上 
双语 语料库 更 加 复杂 。 翻 译 语料库 需 对 翻译 、 译 者 等 要 素 详细 标注 ,对 应 语料库 需 
做 对 齐 处 理 ,类 比 语料库 需 对 文体 主题 ,作者 、 译 者 等 要 素 详细 标注 ;这 就 意味 着 
语料库 翻译 学 的 研究 范围 可 以 扩展 到 文本 外 的 因素 。 三 是 研究 对 象 有 别 。 语 料 库 
翻译 学 探究 的 是 两 种 语言 及 其 转换 的 过 程 , 特 征 和 规律 。 语 料 库 语言 学 不 注重 语 
言 间 的 转换 ,而 是 注重 所 研究 的 语言 本 身 。Baker(1996:185) 认 为 ,在 一 定 意义 上 
来 说 ,翻译 研究 颠倒 了 语料库 语言 学 。 翻 译 研究 者 最 终 感 兴趣 的 不 是 词 和 句法 结 
构 本 身 。 他 们 感 兴趣 的 是 抽象 的 全 局 概念 ,如 独立 于 具体 语言 并 有 各 种 表现 形式 
的 显 化 和 简化 。 我 们 认为 还 有 一 点 重要 区 别 是 对 翻译 文本 的 不 同 态度 。 语料库 语 
言 学 往往 不 认可 翻译 文本 ,许多 语言 学 语料库 将 翻译 文本 排斥 在 外 。 语 料 库 翻译 
学 认为 翻译 文本 记录 真实 的 交际 事件 , 既 不 劣 于 也 不 优 于 其 他 交际 事件 ,具有 独立 
的 价值 (Baker 1993:234) 。 

其 次 ,语料库 翻译 学 不 同 于 翻译 研究 中 传统 的 语言 学 范式 。 我 们 认为 ,主要 有 
如 下 区 别 :一 是 导向 不 同 。 翻 译 研究 中 传统 的 语言 学 范式 以 原文 为 导向 ,强调 与 原 
文 的 对 比 ,目标 是 对 等 。Catford(1965: 20) 就 认为 翻译 是 一 项 对 语言 进行 操作 的 
工作 , 即 用 一 种 语言 的 对 等 的 文本 材料 来 蔡 代 另 一 种 语言 中 的 文本 材料 。 语 料 库 
翻译 学 以 目的 语文 本 为 导向 ,强调 目的 语 中 翻译 文本 与 非 翻 译文 本 的 对 比 。 二 是 
研究 重心 与 语言 观 不 同 。 翻 译 研究 中 传统 的 语言 学 范式 的 重心 是 单个 文本 翻译 的 
微观 转换 分 析 , 分 词汇 ,语法 两 分 。 语 料 库 翻 译 学 的 重心 是 多 个 文本 的 整体 研究 ， 
并 且 不 分 词法 、 句 法 .语义 和 语 用 ,强调 纵 聚 合 。 三 是 理论 概念 及 范畴 不 同 。 翻 译 
研究 中 传统 的 语言 学 范式 以 语言 学 理论 为 基础 进行 对 翻译 产品 和 翻译 过 程 的 分 
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析 , 其 运作 在 传统 语言 学 框架 内 。 语 料 库 翻 译 学 以 语料库 的 技术 手段 为 基础 提出 
了 新 的 翻译 理论 .翻译 概念 和 翻译 范畴 :如 简略 化 . 显 化 ,规范 化 .整齐 化 等 ;以 及 新 
的 技术 手段 :标注 ,检索 ,提取 、 对 齐 、 分 布 .频率 等 。 

再 者 ,语料库 翻译 学 也 不 同 于 翻译 研究 中 90 年 代 后 兴起 的 描写 范式 。Laviosa 
(2003:50) 认 为 描写 翻译 学 与 语料库 翻译 学 有 如 下 区 别 :一 是 在 语料库 翻译 学 范式 
下 ,理论 .数据 ,描写 与 方法 体系 之 间 不 存在 清晰 的 界限 。 在 描写 翻译 学 范式 下 , 理 
论 \ 数 据 、 描 写 与 方法 体系 是 四 个 不 同 的 概念 。 理 论 有 独立 的 功能 。 二 是 描写 翻译 
学 范式 允许 各 种 各 样 的 分 析 方法 ,只 要 这 些 方法 是 经 验 性 的 、 严 格 的 和 描写 的 。 所 
以 ,方法 体系 只 是 描写 翻译 学 范式 的 一 个 维度 ,不 是 其 定义 整体 中 的 一 部 分 。 在 语 
料 库 翻译 学 范式 下 ,研究 对 象 就 是 由 方法 体系 本 身 产生 的 ,也 就 是 说 ,方法 体系 是 
语料库 翻译 学 定义 整体 中 的 一 部 分 。 三 是 在 语料库 翻译 学 范式 下 ,唯一 的 有 效 数 
据 是 真实 的 口语 和 书面 语文 本 。 针 对 译 者 “黑匣子 ”的 任何 形式 的 实验 研究 都 不 在 
语料库 翻译 学 范式 的 研究 范围 之 内 。 在 描写 翻译 学 范式 下 ,这 种 实验 方法 受到 鼓 
励 。 四 是 在 描写 翻译 学 范式 下 ,翻译 学 的 最 终 目 标 是 在 系统 累积 事实 和 局 部 理论 
的 基础 上 建立 起 一 个 普遍 理论 。 在 语料库 翻译 学 范式 下 ,局 部 理论 也 是 有 效 的 , 因 
为 它们 反映 了 各 语言 对 的 异 质 性 及 其 文化 特殊 性 。 我 们 赞成 Laviosa 的 第 二 种 和 
第 三 种 提 法 ,但 不 赞成 第 一 种 和 第 四 种 提 法 。 语 料 库 方法 中 最 重要 的 步骤 不 是 数 
据 的 提取 ,而 是 基于 当前 数据 的 理论 归纳 ,数据 并 不 直接 产生 理论 。 任 何 学 科 范 式 
下 的 理论 ,数据 和 描写 都 是 分 开 的 ,当然 它们 之 间 会 相互 支撑 。 语 料 库 翻 译 学 的 目 
标 绝 不 仅仅 是 满足 于 局 部 的 理论 。 语 料 库 翻 译 学 的 首要 目标 就 是 瞄准 翻译 的 共 
性 ,强调 翻译 文本 本 身 的 特质 。 描 写 翻 译 学 的 目标 是 翻译 活动 中 的 “定律 *(Toury 
1995)。 但 在 数据 的 选择 方面 \ 研 究 方法 的 选择 和 理论 目标 的 选择 上 的 重大 差异 已 
表明 语料库 翻译 学 不 同 于 翻译 研究 中 的 描写 范式 。 

此 外 ,范式 的 检验 通常 通过 两 个 特征 。 一 是 它们 的 成 就 空前 地 吸引 了 一 批 坚 
定 的 拥护 者 ,使 他 们 脱离 科学 活动 的 其 他 竞争 模式 ;二 是 这 些 成 就 又 足以 无 限制 地 
为 重新 组 成 的 一 批 实践 者 留 下 有 待 解决 的 种 种 问题 。 凡 是 共有 这 两 个 特征 的 成 
就 ,Kuhn(1962:10) 称 之 为 “范式 ”。 取 得 范式 后 ,科学 共同 体 的 收获 之 一 就 是 找到 
了 该 研究 领域 选择 研究 问题 的 标准 。 只 有 这 些 问题 是 科学 的 ,其 他 问题 都 是 玄学 
的 。 我 们 认为 ,语料库 翻译 学 已 吸引 了 一 批 坚定 的 拥护 者 ,国外 如 Baker, Laviosa, 
Kenny、Olohan、 Bowker, Halverson, Puurtinen, Zanettin, Øverås 等 ,国内 如 王 克 
非 等 ,提出 了 自己 有 待 解 决 的 问题 并 做 出 了 自己 的 贡献 。 就 像 语料库 语言 学 发 现 
T RERI” (Sinclair 1991/1999) 和 “型 式 ”(Hunston & Francis 2000) 一 样 , 语 料 
库 翻 译 学 发 现 了 翻译 普遍 性 或 称 为 翻译 共性 (Baker 1993) 与 第 三 种 代码 (Frawley 
1984) ;提出 了 自己 的 研究 概念 和 工具 ,如 频率 ,搭配 .词语 索引 分布 .多 因素 分 
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析 等 。 
在 认识 论 上 ,语料库 翻译 学 认为 翻译 具有 内 隐 性 与 经 验 性 , 即 翻译 的 本 质 不 易 
被 察觉 ,但 可 以 体验 。 在 本 体 论 上 ,语料库 翻译 学 预 设 翻译 的 同 质 观 ,并 认为 翻译 
的 原型 未 定 ,所 以 应 采取 现实 中 的 翻译 观 , 而 不 是 绝对 意义 上 的 规约 的 理想 的 翻译 
观 。 在 方法 论 上 ,语料库 翻译 学 不 重视 直觉 和 内 省 方法 的 使 用 ,重视 语料库 驱动 ， 
利用 科学 的 工具 对 自然 发 生 的 真实 翻译 的 观察 及 其 典型 性 的 研究 。 杨 惠 中 (2004: 
编者 按 ) 认 为 ,语料库 语言 学 的 基本 特征 是 以 真实 使 用 中 的 语言 事实 为 研究 对 象 ， 
采用 概率 法 对 语言 事实 进行 分 析 。 语 料 库 翻 译 学 的 基本 特征 是 以 同 质 翻译 观 为 基 
本 理念 ,以 真实 使 用 中 的 大 规模 翻译 事实 表现 为 研究 对 象 ,采用 概率 和 统计 手段 对 
翻译 事实 进行 分 析 。 根 据 王 克 非 (2006:9) 的 分 析 , 我 们 认为 语料库 翻译 学 可 定义 
为 :在 翻译 的 同 质 观 观照 下 ,以 真实 、 自 然 、 大 规模 的 翻译 语 料 为 研究 对 象 ,以 概率 
和 统计 为 方法 ,定量 和 定性 的 描写 翻译 的 特征 ,理论 目标 是 探索 研究 和 提出 翻译 的 
描写 ,解释 与 预测 规律 和 机 制 的 一 门 翻译 学 科 。 语 料 库 翻译 学 范式 地 位 的 确立 将 
有 利于 该 范式 的 全 面 发 展 和 翻译 学 整体 上 的 提升 。 但 这 并 不 是 说 语料库 翻译 学 范 
式 优 于 其 他 翻译 学 范式 。 对 于 同一 种 现象 和 事实 ,用 何 种 范式 来 研究 都 可 能 是 可 
取 的 ,但 是 它们 看 待 研究 对 象 的 方式 和 视角 不 同 。 范 式 决 定 了 我 们 如 何 看 待 对 象 ， 
把 对 象 看 成 什么 ,以 及 怎样 去 看 对 象 ,并 且 进而 选 定 自己 的 研究 问题 。 


4.3 语料库 翻译 学 的 范式 体系 


语料库 翻译 学 的 体系 可 以 从 两 个 层面 考虑 。 一 是 横向 上 的 与 翻译 有 关 的 语 料 
库 建设 ;二 是 纵向 上 的 与 语料库 有 关 的 翻译 研究 。 与 翻译 有 关 的 语料库 可 根据 语 
料 库 中 语种 的 数量 .语料库 的 功能 .语料库 的 方向 性 .语料库 的 时 间 性 进行 划分 。 
根据 语料库 中 语种 的 数量 ,翻译 中 的 语料库 可 分 为 单 语 双语 和 多 语 。 根 据 语料库 
的 功能 ,翻译 中 的 语料库 可 分 为 对 应 语料库 、 类 比 语料库 和 翻译 语料库 。 在 对 应 语 
料 库 中 ,一 般 都 包括 源 语文 本 和 目标 语文 本 ,根据 方向 性 ,又 可 分 为 单 向 的 和 双向 
的 ;根据 时 间 , 又 可 分 为 共 时 的 和 历时 的 。 类 比 语料库 一 般 是 同一 语言 的 ,包含 原 
创 文本 和 翻译 文本 。 翻 译 语料库 专门 由 翻译 文本 构成 ,如 英国 的 TEC 翻译 语 料 
库 , 使 用 时 一 般 与 参照 语料库 对 比 使 用 ,如 BNC。Shledinger(1998) 还 讨论 了 口译 
中 的 语料库 问题 。 目 前 ,口译 研究 中 尚 无 建成 的 语料库 。 口 译 语料库 应 包括 三 类 
文本 :口译 文本 ,相似 情景 下 的 原生 口头 话语 和 这 些 文本 的 书面 翻译 。 语 料 库 的 建 
设 是 语料库 翻译 学 的 前 提 条 件 , 该 项 工作 目前 还 有 待 大 力 发 展 。 

根据 Holmes(1972/1988) Toury(1995/2001:10) 的 翻译 学 总 体 框架 ,纵向 上 
我 们 提出 如 图 4. 1 所 示 的 语料库 翻译 学 的 体系 。 
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图 4.1 语料库 翻译 学 体系 

该 体系 的 特点 是 把 语料库 翻译 学 既 看 作 是 翻译 学 的 一 个 横向 分 支 ,又 看 作 是 
一 个 纵向 分 支 。 总 体 上 ,语料库 翻译 学 分 为 三 个 大 的 层面 :理论 研究 .描写 研究 与 
应 用 研究 。 理 论 研究 分 为 一 般 理论 研究 和 具体 理论 研究 。 具 体 理论 研究 又 可 分 为 
基于 不 同 语言 对 的 语料库 的 理论 研究 (如 英汉 ,法 日 等 ) 和 基于 语料库 中 不 同文 本 
类 型 的 理论 研究 。 谭 载 喜 (2005) 就 提出 了 比较 译 学 的 概念 ,这 是 建立 普通 翻译 理 
论 的 有 效 途 径 。 一 般 理论 研究 指 的 是 以 具体 理论 研究 为 基础 的 翻译 的 共性 和 普遍 
原则 的 研究 。 

此 外 ,一 般 理论 研究 还 可 分 为 产品 普遍 性 和 过 程 普遍 性 的 研究 。 对 于 翻译 理 
论 的 研究 模型 ,Chesterman(2000) 认 为 有 三 种 :比较 模型 、 过 程 模 型 和 因果 模型 。 
比较 模型 指 的 就 是 文本 间 的 比较 ,是 翻译 研究 中 应 用 时 间 最 长 .应 用 频率 最 高 的 模 
型 。 到 目前 为 止 ,大 多 数 的 翻译 研究 都 属 此 类 。 过 程 模型 强调 的 是 时 间 概 念 和 通 
过 有 声 思维 等 进行 数据 诱导 的 实验 方法 。 比 较 模型 的 主要 手段 是 寻找 两 者 之 间 的 
“对 比 中 立项 ”(tertium comparationis) 。 因 果 模 型 的 形式 是 :如 果 X 出 现 ,Y 就 会 
发 生 。 因 果 模 型 强调 文本 、 社 会 . 认 知 领域 的 翻译 的 因 、 过 研究 。 在 这 三 种 模型 中 ， 
因果 模型 是 最 富 成 效 的 ,可 对 四 种 假设 进行 验证 :阐释 性 假设 .描写 性 假设 解释 性 
假设 和 预测 性 假设 。 描 写 性 假设 的 形式 是 :现象 X 的 所 有 实例 都 具有 Y 特征 。 解 
释 性 假设 的 形式 是 : 待 解释 物 的 致 因 /原因 是 X, 或 者 E( 可 能 ) 是 由 条 件 ABC 导致 
的 /影响 的 。 预 测 性 假设 的 形式 是 :因素 X 将 导致 事件 或 状态 Y; 或 者 说 在 ABC 条 
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件 下 ,事件 或 状态 Y 将 /倾向 发 生 。 理 论 的 最 重要 的 功能 就 是 解释 和 预测 。 比 较 
模型 可 以 验证 阐释 性 假设 和 描写 性 假设 ,但 不 能 验证 解释 性 假设 和 预测 性 假设 , 即 
比较 模型 不 能 解释 翻译 为 何 是 这 样 , 而 不 是 那样 ,也 不 能 告诉 我 们 这 样 或 那样 的 后 
果 。 所 以 ,语料库 翻译 学 的 理论 模型 应 包含 两 个 层面 :第 一 层面 是 比较 模型 ,第 二 
层面 是 因果 模型 。 目 前 大 多 数 的 语料库 翻译 研究 属于 比较 模型 下 的 研究 , 即 探究 
翻译 现象 阶段 ( 刘 康 龙 , 穆 雷 2006:63)。 所 以 ,未 来 的 语料库 翻译 学 的 理论 研究 需 
向 因果 模型 提升 。 

对 于 翻译 学 的 理论 目标 , Toury(1995/2001:264-265) 认 为 应 该 是 找寻 翻译 “ 定 
律 ”, 而 此 定律 具有 概率 性 ,其 形式 为 :如 果 X, 则 Y 的 可 能 性 就 更 大 /更 小 。 对 于 复 
杂 的 翻译 现象 ,很 难 用 一 个 定律 来 概括 。 徐 盛 桓 (2007:3) 认 为 ,当代 语言 学 正经 历 
着 原子 论 向 整体 论 ,构成 论 向 生成 论 、 原 则 论 向 建 模 论 的 转换 。 我 们 认为 翻译 学 研 
究 的 因果 模型 也 是 整体 论 、 生 成 论 与 建 模 论 倾向 的 。Tymoczko(2005) 就 探讨 了 作 
为 表征 的 翻译 。 对 于 翻译 学 的 建 模 ,我 们 认为 可 有 向 外 的 情景 建 模 与 向 内 的 心理 
建 模 。 在 心理 建 模 方面 ,以 常规 关系 、 相 似 、 相 邻 关 系 为 基础 ,以 推导 、 推 衍 为 手段 ， 
徐 盛 桓 (2007:5) 提 出 了 话语 的 “自主 -依存 分 析 框 架 ” 和 “ 显 性 表述 - 隐 性 表述 推导 
模式 ”。 这 可 以 为 语料库 翻译 学 理论 建 模 提供 启示 。 以 语料库 为 基础 ,以 计算 机 为 
手段 ,语料库 翻译 学 正 是 翻译 学 理论 建 模 的 上 佳 选择 。Holmes(1988:71) Toury 
《1995/2001 :9) 和 刘 密 庆 (2005:15) 都 认为 翻译 学 是 一 门 经 验 性 科学 。 所 以 ,对 于 
翻译 学 来 说 ,描写 尤为 重要 。 

对 于 描写 研究 ,语料库 语言 学 家 Aarts(1999:6-7) 认 为 语言 使 用 的 描写 模型 应 
满足 四 点 要 求 : 一 是 模型 应 允许 对 数据 定性 与 定量 描写 的 结合 ;二 是 模型 必须 建立 
语言 系统 内 部 的 现象 与 语言 系统 外 部 的 现象 间 的 关系 ;三 是 模型 应 能 允许 对 各 种 
变 体 的 描写 ;四 是 模型 应 能 允许 对 词句 和 篇 的 整合 描写 。 在 对 语 料 进 行内 部 描写 
的 同时 ,也 要 对 语 料 进行 外 部 描写 。 语 料 库 翻 译 学 的 描写 研究 也 应 该 满足 这 四 个 
方面 的 要 求 。Tymoczko(1998:6-7) 在 描述 语料库 翻译 学 未 来 发 展 时 指出 了 两 个 
重要 方面 :一 是 翻译 研究 中 语言 与 文化 路 向 的 整合 ;二 是 意识 形态 如 何 影 响 翻 译 。 
所 以 ,语料库 翻译 学 应 充分 发 挥 标注 丰富 的 优点 ,进行 语言 内 外 部 的 整合 描写 ,而 
目前 基本 没有 进行 基于 语料库 的 外 部 描写 。 对 于 应 用 研究 ,目前 主要 是 翻译 教学 
和 培训 。Bowker(1998) 的 实验 表明 语料库 辅助 能 够 提高 翻译 质量 ,特别 是 在 术语 
和 专业 领域 知识 方面 。 秦 洪武 . 王 克 非 (2007) 探 讨 了 对 应 语料库 在 翻译 教学 中 的 
原则 与 理据 。 由 于 理论 研究 和 描写 研究 的 不 充分 以 及 方法 和 工具 的 不 到 位 ,在 其 
他 方面 尚未 展开 。 对 于 理论 研究 、 描 写 研 究 和 应 用 研究 三 个 大 层面 之 间 的 关系 ,我 
们 认为 描写 研究 与 理论 研究 之 间 的 关系 是 双向 的 ,描写 是 建立 理论 的 基础 ,理论 又 
是 描写 的 指导 ; 另 一 方面 描写 研究 与 应 用 研究 之 间 的 关系 也 是 双向 的 ,描写 为 应 用 
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提供 指导 ,应 用 又 促进 描写 。 但 理论 与 应 用 之 间 并 不 直接 关系 ,而 是 通过 描写 的 
中 介 。 


4.4 ”语料库 翻译 学 范式 的 当下 问题 


虽然 ,语料库 翻译 学 已 取得 了 不 少 成 就 ,但 也 有 着 自己 尚未 解决 的 范式 问题 。 

一 是 “对 比 中 立项 ”问题 。Baker(2004:7) 指 出 ,翻译 研究 中 基于 语料库 的 原始 
动因 就 是 翻译 文本 与 非 翻 译文 本 的 相似 性 与 差异 性 的 比较 ,从 而 找 出 翻译 文本 整 
体 上 所 特有 的 型 式 。Tymoczko(1998:7) 认 为 ,语料库 翻译 学 的 重要 影响 之 一 就 是 
提高 了 翻译 研究 中 差异 (与 原生 文本 ) 的 地 位 。 所 以 ,语料库 翻译 学 中 最 重要 的 语 
料 库 是 类 比 语料库 。 也 就 是 说 , 目前 语料库 翻译 学 的 主要 模型 就 是 比较 模型 。 比 
较 模 型 的 难点 就 是 对 比 中 立项 的 确定 。 翻 译 通常 体现 的 是 非 对 称 关 系 。 在 翻译 
中 ,我 们 经 常 选择 一 些 作家 ,一 些 体裁 一 些 主题 ,而 不 选择 另 一 些 作家 、 另 一 些 体 
裁 . 另 一 些 主题 。Bernardini(2005:9) 发现 ,翻译 成 英语 的 意大利 作家 多 数 是 上 流 
作家 ,而 翻译 成 意大利 语 的 英语 作家 则 多 为 通俗 作家 。 此 外 ,Kenny(1998: 53) 还 
注意 到 ,有 的 文学 体系 中 根本 就 没有 那 种 体裁 ,而 是 通过 翻译 来 引入 的 。 在 这 种 情 
况 下 ,我 们 又 如 何 去 对 比 ? 

二 是 方法 论 问 题 。Kenny(2000:93) 认 为 ,目前 专门 适合 翻译 研究 的 语料库 研 
究 方法 还 不 到 位 。 目 前 的 语料库 翻译 学 的 理论 研究 , 即 翻译 普遍 性 的 研究 的 方法 
主要 是 逆 证 (abduction) 。 逆 证 是 由 美国 哲学 家 Peirce 在 探讨 推理 的 性 质 时 提出 
的 ,由 Anderson(1973) 引 入 语言 学 研究 中 来 并 提出 了 “ 逆 证 创新 ”的 概念 。 从 此 ， 
逆 证 概念 在 语言 学 研究 中 广泛 应 用 ,并 被 认为 是 语言 学 理论 创新 的 逻辑 基础 。Peirce 
(1931-1966:623) 早 期 提出 的 逆 证 形式 是 


前 提 :[ 普 遍 规 则 ] 
从 这 个 绕 子 中 取出 的 所 有 的 豆子 都 是 白色 的 ; 
[ 待 解释 的 观察 到 的 事实 ] 
这 些 豆 子 是 白色 的 ; 

结论 : 


[ 找 出 解释 上 述 事实 的 规则 ] 
这 些 豆子 是 取 自 这 个 袋子 。 


对 于 Peirce 的 早期 定义 ,Deutscher(2002:474) 认为 此 定义 有 两 大 缺陷 :一 是 
这 种 前 提 与 结论 的 变换 是 肤浅 的 ,并 不 是 真正 的 概念 飞 路 ， 而 只 是 对 一 显 性 特质 的 
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概括 ;二 是 该 定义 过 于 狭隘 , 逆 证 仅 是 一 已 知 规则 与 待 解释 的 观察 到 的 事实 间 的 匹 
配 。 后 来 ,Peirce(1931-1966:189) 就 将 该 定义 进行 了 修改 : 


前 提 : 观 察 到 令 人 惊奇 的 事实 C; 
若 A 正确 ,C 就 可 能 是 当然 的 ; 
结论 :因此 有 理由 相信 A 是 正确 的 。 


从 此 , 逆 证 就 成 了 对 已 观察 到 的 事实 进行 假设 推理 的 过 程 。 这 种 推理 经 过 进 
一 步 的 发 展 就 成 为 了 今天 的 “寻找 最 佳 解释 的 推理 ”(Deutscher 2002:476)。 但 由 
于 递 证 推理 属于 扩展 推理 ,不 是 演绎 推理 ,因此 在 逻辑 上 仍 是 站 不 住 脚 的 。 我 们 认 
为 , 受 语言 学 界 的 影响 ,目前 的 翻译 普遍 性 研究 就 是 基于 这 样 的 推理 模式 。 下 面 ， 
我 们 以 翻译 普遍 性 之 一 “简化 "为 例 阐明 这 一 推理 模式 : 


前 提 : 观 察 到 反常 事实 : 译 者 经 常用 上 义 词 熟悉 的 词 蔡 代 译 语 中 没有 等 
值 的 词 ; 若 有 一 个 规则 是 正确 的 “翻译 是 简化 的 '，' 译 者 经 常用 上 义 词 , 熟 悉 的 
词 替 代 译 语 中 没有 等 值 的 词 " 的 事实 就 是 当然 的 ; 
结论 :因此 ,我 们 有 理由 相信 有 这 样 一 个 规则 
(所 以 ,翻译 是 简化 的 ) 。 


这 里 的 问题 是 第 二 个 前 提 没 有 依据 ,也 就 是 说 逆 证 使 用 了 缺 省 的 知识 。 单 调 
逻辑 的 形式 为 :[(p~q) & p]-~q( 能 学 亮 2007:106) 。 单 调 逻 辑 的 正确 前 提 一 定 
蕴含 正确 的 结论 ,不 会 出 现 例外 的 情况 。 但 非 单调 逻辑 不 一 样 ,因为 没有 逻辑 结构 
上 的 严密 性 ,所 以 具有 逻辑 不 可 靠 的 特点 。 也 就 是 说 我 们 可 以 有 无 限 个 A。 在 这 
里 ,我 们 改动 一 下 能 学 亮 ( 同 上 :92) 的 例子 如 下 :The man sew the rat eating the 
corn。 如 果 把 这 句 话 当 作 事实 C, 则 A 可 能 的 形式 有 Al: 荒 诞 的 词 序 排列 ; A2: 有 
拼写 错误 ;,A3: 有 特殊 意义 。 我 们 又 如 何 能 够 判定 哪 一 个 A 是 最 合理 的 呢 ? Peirce 
曾 提出 了 简单 性 ,经 济 性 与 易 证 伪 的 标准 ( 转 引 自 Deutscher 2002:476) 。 但 这 些 
标准 都 是 比较 模糊 的 。 此 外 ,Deutscher( 同 上 :476) 认 为 ,Peirce + YA PM BA “ABLE 
的 可 能 性 ”与 “理解 的 量 ” 之 间 的 关系 ,最 可 能 的 解释 不 一 定 提供 最 大 量 的 理解 。 
Hobbs《2004:740) 也 指出 ,他 没有 找到 判断 这 些 相 互 竞 争 的 规则 或 假设 的 尺度 。 
这 些 假设 既 有 可 能 被 验证 和 认可 ,也 有 可 能 被 修正 或 推翻 ,并 没有 逻辑 上 的 必然 
性 。 推 理 有 两 种 形式 :演绎 推理 和 扩展 推理 。 扩 展 推理 又 分 为 归纳 和 逆 证 。 扩 展 
推理 虽 有 貌似 的 心理 现实 性 ,但 无 逻辑 现实 性 。 翻 译 普遍 性 的 逆 证 推理 也 属于 扩 
展 推理 ,所 以 没有 逻辑 上 的 有 效 性 。 但 这 并 不 是 说 推理 在 理论 创建 中 不 重要 。 相 
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反 , 推 理 位 于 任何 理论 创新 的 核心 ,只 是 要 正确 使 用 ,不 能 误 用 。Anderson(1973: 
775) 认 为 ,假设 效 度 的 检验 就 是 演绎 与 归纳 的 事情 ,演绎 预测 规则 的 结果 ,归纳 将 
假设 与 新 的 观察 到 的 现象 与 结果 匹配 。 

目前 ,在 语料库 翻译 学 领域 ,在 研究 目标 和 研究 内 容 上 相互 区 别 的 学 者 持 不 同 
的 观点 与 不 同 的 描述 和 分 析 , 在 理论 体系 上 交 杂 撮合 的 成 分 较 多 。Tymoczko 
(1998:6) 就 认为 ,语料库 翻译 学 的 主要 吸引 力 不 是 首先 去 找寻 普遍 性 ,而 是 首先 以 
P niee eea 在 研究 方 

上 ,语料库 翻译 学 也 尚 有 未 解决 的 问题 。 这 显露 出 语料库 翻译 学 这 一 新 兴学 科 
0 但 并 不 能 否定 语料库 翻译 学 作为 一 个 新 的 翻译 学 研究 范式 。 
在 本 体 论 .认识 论 和 方法 论 方面 ,语料库 翻译 学 都 体现 了 自己 独特 的 学 术 特征 , 因 
而 是 翻译 学 的 新 的 研究 范式 ,并 有 着 自己 的 范式 体系 。 这 就 意味 着 语料库 范式 可 
以 在 翻译 学 的 三 个 层面 :理论 层面 \ 描 写 层面 和 应 用 层面 全 面 展开 ,从 而 为 90 年 代 
文化 转向 后 的 翻译 学 “本 体 论 上 面临 着 被 瓦解 的 风险 , 消 缉 在 文化 研究 之 中 ”的 本 
体 危 机 打开 一 条 出 路 ,让 翻译 学 实现 本 体 回归 。 对 于 翻译 学 来 说 ,重要 的 是 要 回答 
关于 翻译 的 其 他 学 科 没有 提出 的 问题 ,特别 重要 的 是 ,关于 翻译 的 要 求 与 其 他 学 科 
有 不 同 的 答案 的 问题 。 语 料 库 翻译 学 就 是 要 认可 翻译 文本 的 独特 价值 ,确立 翻译 
文本 整体 上 所 特有 的 特征 ,而 不 是 将 翻译 置 于 其 他 理论 框架 之 下 ,如 文化 研究 、 交 
际 研究 等 。 
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第 5 章 
语料库 翻译 学 的 研究 课题 


本 章 介 绍 了 语料库 翻译 学 的 新 研究 范式 所 带 来 的 主要 研究 课题 及 其 进展 , 包 
括 语料库 建设 、 翻 译 共性 研究 、 翻 译 语言 特征 . 译 者 风格 研究 .语料库 翻译 应 用 和 基 
于 语料库 的 翻译 教学 研究 等 方面 。 这 些 研究 为 当代 翻译 学 开辟 了 新 的 研究 课题 ， 
是 语料库 翻译 学 目前 方兴未艾 的 主要 学 术 阵地 。 


5.1 引言 


本 书 第 1 部 分 第 4 章 中 回顾 了 语料库 翻译 学 的 发 展 历程 。 我 们 知道 ,任何 基 
于 语料库 的 研究 一 定 离 不 开 其 实证 的 基础 和 研究 的 基本 源泉 一 一 语料库 的 建设 。 
第 1 部 分 第 3 章 从 语料库 的 定义 ,分 类 和 发 展 等 方面 讨论 语料库 建设 的 理论 层面 。 
本 章 集中 介绍 国内 专门 用 于 翻译 研究 的 语料库 建设 情况 。 随 后 逐一 介绍 语料库 翻 
译 学 在 理论 研究 层面 和 应 用 研究 层面 的 研究 课题 :翻译 共性 、 翻 译 语言 特征 、 译 者 
风格 、 翻 译 应 用 和 翻译 教学 等 。 


5.2 国内 双语 语料库 建设 与 研究 


对 于 语料库 翻译 学 来 所 ,设计 和 研制 语料库 是 一 个 不 可 或 缺 的 基础 。 建 成 了 
语料库 , 才 有 可 能 开展 新 课题 研究 。 近 年 来 ,新 的 语料库 不 断 创建 ,新 的 课题 也 在 
不 断 探 讨 。 仅 以 北京 外 国语 大 学 大 型 “ 汉 英 对 应 语料库 ”来 说 ,在 该 库 基 础 上 已 开 
展 了 许多 研究 ( 王 克 非 等 ,2004b) ;后 ( 据 2008 年 8 月 上 海 世界 翻译 大 会 最 新 资料 ) 
又 有 秦 洪 武 凭借 该 库 做 翻译 语言 分 析 。 他 发 现 ,汉语 翻译 语言 与 汉语 原创 语言 在 
语言 运用 的 宏观 特征 有 差异 :翻译 语 在 词汇 密度 上 低 于 原创 语 , 在 句 长 上 翻译 语 则 
高 于 原创 语 。 这 说 明 翻 译 语 较 原创 文本 在 词语 使 用 上 不 如 汉语 原创 文本 用 词 丰 
富 ,而 且 句 子 偏 长 。 关 键 词 对 比 显示 ,汉语 翻译 文本 和 汉语 原创 文本 在 名 词 使 用 上 
的 差异 最 为 明显 。 在 介词 连词 代词 和 方位 词 使 用 上 ,汉语 翻译 文本 在 使 用 的 数 
量 和 频率 上 都 远 远 高 于 汉语 翻译 文本 ,但 在 动词 使 用 上 两 者 没有 明显 差异 。 在 句 
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法 组 织 方式 方面 ,翻译 语言 与 原创 文本 语言 的 差异 主要 表现 在 动词 和 宾语 之 间 的 
线性 距离 上 ,前 者 明显 高 于 后 者 。 

黄 立 波 则 利用 该 库 探究 英汉 翻译 中 人 称 代词 主语 的 显 化 问题 。 他 对 英汉 翻译 
中 人 称 代 词 主语 在 文学 和 非 文 学 两 种 文体 类 型 中 数量 、 频 次 和 转换 类 型 三 方面 进 
行 考察 ,发 现 :1) 文 学 与 非 文 学 英 译 汉 时 ,人 称 代词 主语 数量 和 频次 均 呈 减少 趋势 ; 
2) 从 转换 类 型 看 ,人 称 代词 主语 转换 以 对 应 关系 为 主 , 语 际 显 化 和 隐 化 均 不 明显 
3) 相 对 非 翻译 汉语 文本 ,汉语 翻译 文本 类 比 显 化 突出 。 在 英 译 汉 过 程 中 ,人 称 代词 
主语 语 际 转换 表现 出 源 语 迁移 现象 ; 语 内 类 比 显 化 突出 。 他 认为 根本 原因 在 于 英 、 汉 
语 对 形式 手段 依赖 程度 的 差异 ,以 及 语言 相对 社会 地 位 和 认 知 规律 等 因素 的 作用 。 

燕山 大 学 新 近 研 制 的 (红楼 梦 ) 中 英文 语料库 也 值得 注意 。 这 是 一 个 一 本 多 译 
的 翻译 语料库 。 该 库 以 《红楼梦 ) 汉 语 原本 与 三 种 英语 译本 构成 名 级 对 应 语料库 ， 
可 以 进行 中 英 对 照 英 英 对 照 研究 和 互联 网 自动 链接 检索 ,使 相关 学 者 得 以 充分 利 
用 语料库 储存 数据 大 、 计 算 机 运行 速度 快 .有 多 种 语料库 工具 可 以 对 大 量 数据 进行 
分 析 的 诸多 优势 ,多 方位 多 角度 地 对 三 个 英 译本 在 翻译 技巧 运用 ,文体 设计 .语言 
选择 、 文 化 内 容 处 理 等 方面 开支 研究 。 该 项 目的 主要 特点 是 :1) 收 集 汉 语 120 回 原 
文 和 120 回 的 替 克 斯 、 闵 福 德 译本 、 杨 宪 益 夫妇 全 译本 及 56 回 的 乔 利 译本 。 这 一 
个 原本 、 三 个 译本 构成 四 个 单 语 语料库 ,可 分 可 合 , 既 可 作为 一 个 汉语 语料库 对 应 
任何 一 个 英 译本 的 双语 对 应 语料库 ,又 可 作为 三 个 译本 的 单 语 语 内 语料库 ,分 别 用 
于 中 英 对 照 和 英 英 对 照 研究 。2) 该 语料库 做 了 句 级 平行 对 应 ,并 对 汉 英 句子 的 类 
型 . 语 类 、 语 域 \ 语 态 及 有 无 修辞 、 习 语 等 进行 了 标注 。 在 ParaConc 等 检索 工具 的 
帮助 下 可 自由 提取 语料库 中 的 汉 英 名 对。 各 个 单 语 数 据 库 支持 WordSmith、 
AntConc、EditPlus 等 检索 工具 对 文本 各 种 信息 和 语言 特色 的 检索 分 析 。3) 可 以 
对 该 语料库 做 统计 分 析 , 开 展 各 项 研究 ,具体 包括 中 英文 各 文本 词 频 排列 表 、 词 目 
表 , 词 目 分 布 表 ,各 译本 句 目 、 句 长 .词语 搭配 .句子 类 型 等 语言 特色 以 及 翻译 技巧 
的 对 比分 析 等 。4) 该 库 建立 了 网 络 搜索 平台 ,实现 互联 网 自动 链接 检索 。 通 过 该 
检索 平台 可 进行 基于 汉 英 文本 内 容 和 句子 属性 的 检索 ,同时 还 支持 对 译本 、 章 回 、 
句子 属性 、 词 频 及 句 长 等 的 选择 性 检索 。 

此 外 ,各 地 学 者 纷纷 建立 各 具 特 色 的 语料库 ,开展 自己 感 兴趣 的 研究 。 仍 以 不 
和 久 前 举行 的 世界 翻译 大 会 情况 看 ,就 有 1) Maeve Olohan 以 自己 的 语料库 研究 翻译 
的 普遍 特征 问题 ;2) 胡 开 宝 研制 莎士比亚 汉 译 语料库 ,探讨 汉 译 中 的 显 化 问题 ;3) 
胡 显 炊 基 于 自 建 汉 译 小 说 语料库 进行 翻译 小 说 虚词 特征 研究 ;4) Wallace Chen 基 
于 语料库 探讨 建立 英汉 翻译 显 化 模式 ;5) 王 建新 基于 语料库 研究 英汉 语 中 的 转折 
连接 词 ; 6) 戴 光 荣 基于 自 建 平行 语料库 基础 上 的 翻译 显 化 研究 ;7) Willy 
Vandeweghe & Lidia Rura 则 试图 建立 一 个 平行 语料库 作为 译 者 的 多 功能 辅助 工 
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具 ;8) 董 娜 以 自 建 语料库 开展 林语堂 作品 的 翻译 研究 ;9) 夏 云 以 自 建 小 型 语料库 进 
行 可 比 文本 分 析 与 应 用 文体 翻译 研究 ,等 等 。 北 京 外 国语 大 学 计划 创建 一 个 新 的 
语料库 ,原创 文学 与 翻译 文学 语料库 ,是 一 个 类 比 语料库 (comparable corpus), 
拟 收录 约 1000 万 字 的 20 世纪 前 半 叶 原创 的 小 说 ,散文 ( 含 小 品 文 ) 和 翻译 小 说 、 散 
文 及 其 英文 原文 ,以 便 1) 考 察 现代 汉语 白话 文 的 早期 发 展 ,特别 是 词汇 和 句 式 上 
的 变化 ;2) 考 察 20 世纪 前 期 英语 文学 翻译 的 特征 和 变化 ;3) 分 析 比 较 原 创 文学 与 
翻译 文学 在 语言 上 的 异同 及 翻译 对 创作 在 语言 及 其 他 表现 形式 上 的 影响 。 


5.3 国际 双语 语料库 建设 与 研究 


当代 翻译 研究 呈现 出 一 种 多 元 化 的 趋势 , 除 传统 的 文学 翻译 研究 方法 和 兴起 于 
20 世纪 50,60 年 代 的 语言 学 研究 方法 外 ,70 年 代 德 国 的 功能 理论 和 以 色 列 的 多 元 系 
统 论 ,80 年 代 翻 译 研究 的 文化 转向 和 翻译 研究 学 派 的 操纵 论 .媒介 论 , 以 及 90 年 代 以 
来 的 语料库 翻译 研究 理论 与 方法 ,无 不 在 向 世人 展示 翻译 研究 作为 一 门 独立 的 学 科 
体系 已 经 靳 露头 角 。 下 面 结合 Alessandra Riccard 所 编 文集 ; Translation Studies 
Perspectives on an Emerging Discipline(2002)# G. Anderman and M. Rogers 合 
编 的 Translation Today : Trends and Perspectives (Clevedon: Multilingual Matters Ltd. 
2003) LAB S. Granger,J. Lerot and S, Petch-Tyson(4i)Corpus-based Approaches 
to Contrastive Linguistics and Translation Studies (Amsterdam; Rodopi. 2003), 
介绍 国际 上 双语 语料库 驱动 的 翻译 研究 。 

从 语料库 途径 探究 翻译 的 一 个 显著 特点 就 是 关于 翻译 普遍 性 的 讨论 。 语 料 库 
不 仅 使 我 们 可 以 同时 观察 大 量 的 翻译 文本 ,而 且 可 以 观察 多 种 语言 之 间 的 翻译 现 
象 ,从 而 有 可 能 概括 出 翻译 的 普遍 特性 。 

Laviosa 是 较 早 依据 双语 语料库 开展 翻译 研究 的 学 者 ,她 提出 了 “基于 语料库 的 
翻译 研究 ”(corpus-based translation studies) 范 式 。 她 从 Toury 提出 的 “描写 翻译 研 
3%” (descriptive translation studies) 与 基于 语料库 的 翻译 研究 之 间 的 联系 人 手 , 指 出 了 
两 者 的 共性 :第 一 ,注重 从 实证 的 角度 对 真实 语 料 进行 直接 观察 ;第 二 ,对 语料库 文本 
的 选择 并 非 基于 某 个 固定 的 定义 ,而 是 建立 在 共识 性 标准 和 外 部 分 类 的 基础 上 ,必要 
时 采取 随机 抽样 的 方式 ;第 三 ,两 种 方法 都 坚持 认为 从 实证 性 研究 中 得 出 的 一 般 性 结 
论 只 有 建立 在 对 大 量 文本 语 料 研究 的 基础 之 上 才能 保证 其 有 效 性 ;第 四 ,适用 于 研究 
对 象 的 各 种 原则 都 是 经 过 大 量 系统 的 研究 来 发 现 ,并 以 概率 性 规则 作为 表述 形式 
(Granger et al. 2003:45-56)。 她 还 曾 在 博士 论文 里 详尽 地 论述 了 翻译 普遍 性 问题 ， 
包括 翻译 中 的 简化 (simplification) 、 显 化 (explicitation) , #4& (normalization) A$ 
征 。 总 之 ,基于 语料库 的 翻译 研究 范式 是 在 原 有 研究 范式 的 基础 上 孕育 产生 的 ,其 
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最 大 的 优势 在 于 新 颖 灵活 的 研究 方法 和 采用 不 同 语言 及 其 翻译 的 大 量 真实 语 料 。 

例如 ,Tiina Puurtinen 以 芬兰 语 单 语 类 比 语料库 为 工具 ,对 原创 芬兰 语 儿童 文 
学 与 译 自 英语 的 儿童 文学 作品 中 的 语言 进行 对 比 。 他 发 现 ,翻译 文本 中 非 限定 性 
结构 的 出 现 频次 要 高 于 原创 作品 ;翻译 文本 中 所 使 用 非 限定 性 结构 在 语义 ,文体 和 
语 用 功能 上 与 原创 作品 对 该 结构 的 使 用 不 对 等 。 他 由 此 得 出 结论 (Granger et. al. 
2003:141-156) : 非 限定 性 结构 是 芬兰 翻译 儿童 文学 中 翻译 语言 的 一 大 特征 。 然 
而 ,这 一 特征 与 通常 的 翻译 普遍 性 假设 一 简化 、 显 化 、 范 化 相 违 背 ,因为 非 限定 性 结 
构 的 使 用 会 降低 译文 的 明晰 度 , 增 大 词汇 密度 和 信息 负载 ,而 且 大 量 的 非 限定 性 结 
构 背 离 了 原创 儿童 文学 的 语言 规范 。 尽 管 基于 语料库 的 研究 方法 的 优势 不 言 而 
喻 ,但 这 一 研究 却 为 我 们 提出 了 一 些 新 问题 :第 一 , 印 欧 语系 内 部 基于 语料库 的 研 
究 的 结果 是 否 具有 更 广泛 的 普遍 性 呢 ? 如 果 有 ,那么 这 一 普遍 性 存在 的 基础 是 什 
么 呢 ? 如 何 将 这 样 的 共性 特征 应 用 于 翻译 实践 中 ? 第 二 ,基于 语料库 的 翻译 研究 
方法 的 有 效 性 到 底 有 多 大 ? 对 此 有 效 性 的 衡量 应 以 何 为 标准 ? 这 些 问 题 的 探究 将 
有 利于 基于 语料库 的 研究 方法 的 进一步 完善 。 

Juliane House 则 探讨 “翻译 中 的 普遍 性 与 文化 特性 ”(Universality Versus 
Cultural Specificity in Translation, in Riccardi 2002:92-110)。 她 回顾 了 翻译 研究 
中 语言 学 范式 和 文化 范式 的 历史 ,尤其 是 对 语言 -文化 相对 论 与 翻译 理论 及 实践 之 
间 的 关系 。 她 主张 采用 以 语言 学 为 主导 .兼顾 语 用 与 跨 文 化 的 研究 范式 ,并 确认 了 
两 个 基础 性 的 翻译 类 型 /范畴 :“ 显 形 翻 译 "(overt translation) 与 “隐形 翻译 ”(covert 
translation) 。 前 者 是 指 在 译文 中 保留 原作 特色 ,使 其 明显 不 具有 译 语文 化 中 原创 
文本 的 特征 ;后 者 是 指 在 译作 中 掩盖 原作 的 特色 ,使 之 完全 迎合 译 语 读者 的 口味 ， 
看 不 出 其 与 译 语文 化 中 原创 文本 的 差异 。 她 进而 提出 “文化 过 滤器 ”(cultural 
filter) 的 概念 ,用 来 指 译 者 在 翻译 中 对 文化 特性 进行 补偿 的 手段 。 通 过 纯 语言 学 研 
究 范式 与 纯 文化 研究 范式 的 有 机 结合 ,House 的 观点 填补 了 两 者 之 间 的 鸿沟 。 她 
还 指出 ,英语 作为 全 球 通用 语 在 文化 过 滤 中 的 角色 所 导致 的 结果 就 是 “文化 普遍 主 
义 ”(cultural universalism) 的 出 现 。 

从 国内 国际 上 的 双语 语料库 建设 及 相关 研究 可 以 看 出 ,语料库 翻译 学 方 兴 未 
艾 , 给 翻译 研究 带 来 许多 新 的 视角 和 新 的 课题 。 下 面 继 续 从 理论 层面 讨论 。 


5.4 理论 层面 的 研究 课题 


5.4.1 翻译 共性 研究 
对 翻译 共性 的 研究 是 语料库 翻译 学 的 重要 贡献 和 主要 学 术 创新 的 源泉 之 一 。 
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早期 ,Vanderauwera(1985) 曾 以 五 部 荷兰 语 小 说 的 英 译 本 为 语 料 ,讨论 翻译 语言 中 
表现 出 的 简化 、 显 化 和 范 化 ,可 视 为 基于 语料库 的 翻译 共性 研究 的 嘴 矢 。 后 有 
Gellerstam(1986) 对 比 瑞典 语 翻 译 和 非 翻 译 小 说 文本 ,从 语 内 类 比 角度 讨论 了 “ 翻 
译 体 ”(translationese) 的 语言 特征 。 这 些 研究 都 不 同 于 传统 的 “对 等 ”理念 指导 下 
的 翻译 研究 ,而 关注 起 翻译 转换 中 语言 之 间 的 相互 作用 带 来 的 语言 变化 以 及 促成 
此 类 变化 的 语言 内 、 外 因素 ,开辟 了 新 的 翻译 研究 途径 。Baker(1993:243-244) 在 
前 人 研究 成 果 的 基础 上 ,提出 了 翻译 普遍 特征 (universal features of translation) 的 
假设 ,其 中 为 学 界 讨论 最 多 的 是 “ 显 化 ”“ 简 化 ”和 “ 范 化 ”。 

其 他 共性 研究 例如 , Laviosa 调查 了 英语 翻译 文本 中 的 四 种 核心 词汇 运用 模 
式 ,讨论 译文 与 母语 原创 文 在 词汇 使 用 上 的 不 同 ;Kenny 通过 对 原文 ,译文 的 语义 
韵 比较 ,发 现 译文 语言 有 净化 (sanitisation) 现 象 ;veras 以 英 译 挪 和 挪 译 英 各 20 
本 翻译 小 说 的 前 50 名 (总共 2000 句 ) 为 例 ,考察 了 英语 -挪威 语 翻 译 中 衔接 层面 上 
的 显 化 现象 ; 王 克 非 根据 大 型 对 应 语料库 探讨 了 译本 扩 增 情况 ; 柯 飞 通过 语料库 考 
察 ,发 现 翻译 过 程 中 对 原文 的 模仿 可 能 使 译文 变 得 复杂 化 、 完 长 化 (模仿 原作 )， 
Xiao & McEnery 发 现在 “ 体 "标记 的 使 用 上 , 汉语 译文 比 汉语 原 文 多 出 约 一 倍 ; 
Ebeling 比较 了 英语 和 挪威 语 在 存 现 句 使 用 上 的 特点 ;Maia 以 双语 对 应 语料库 观 
察 英语 和 葡萄 牙 语 在 人 称 主语 使 用 频率 上 的 差异 ,等 等 ( 王 克 非 2004b:182-183) 。 
黄 立波 (2007) 重 点 探讨 翻译 中 连接 成 分 和 人 称 代词 主 语 的 显 化 和 隐 化 ,区 分 出 语 
际 显 化 和 语 内 显 化 的 概念 。 前 者 以 汉 译 英 为 代表 ,汉语 原文 中 隐 而 不 显 的 内 在 连 
接 和 人 称 代词 ,在 翻译 成 英语 时 往往 需要 显 化 为 外 在 的 连接 和 人 称 ,呈现 跨 语 言 显 
化 , 即 语 际 显 化 ;后 者 以 英 译 汉 为 代表 ,英语 原文 中 外 显 的 连接 成 分 和 人 称 代词 ,在 
翻译 成 汉语 时 通常 都 会 被 照搬 进 译文 ,与 汉语 原创 相 比 ,这 些 成 分 的 比重 会 超出 很 
多 ,呈现 出 汉语 译文 和 汉语 原文 的 不 同 , 即 语 内 显 化 。 

基于 语料库 的 翻译 共性 研究 呈现 如 下 特点 :1) 多 以 共 时 语 料 为 研究 对 象 ,主要 
依靠 计算 机 技术 分 析 数 据 ,如 平均 句子 长 度 、 形 符 /类 符 比率 、 词 汇 密度 等 手段 对 词 
汇 多 样 性 ,信息 负载 度 等 方面 进行 考察 ;2) 以 对 普遍 性 的 验证 和 描写 为 主 ,解释 较 
少 ;3) 理 论 阐述 与 实证 研究 相 结合 ;4) 国 外 学 者 多 以 单 语 类 比 语料库 为 基础 ,探究 
相对 于 目标 语 原创 文本 而 言 的 翻译 文本 特征 。 因 此 ,翻译 共性 研究 还 有 不 少 未 能 
解决 的 问题 ,也 尚未 取得 学 界 的 共识 。 但 基于 语料库 有 助 于 宏观 认识 翻译 是 获得 
认可 的 。 


5.4.2 翻译 文体 研究 


Baker 在 “语料库 语言 学 与 翻译 研究 :启示 与 应 用 ”(1993) 一 文中 对 这 两 者 的 
结合 作 了 初步 阐发 。 在 大 范围 翻译 调查 方面 ,如 翻译 文体 的 考察 ,她 (2000) 也 率先 
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从 语料库 角度 探讨 译 者 的 文体 特征 ,特别 是 从 类 符 - 形 符 比 .平均 句 长 及 词 项 使 用 
特点 等 方面 加 以 分 析 。 她 (2000:245) 将 文体 定义 为 “ 留 在 文本 中 的 一 系列 语言 及 
非 语言 的 个 性 特征 ”。 她 认为 翻译 文体 包括 译 者 的 选材 、 惯 用 的 具体 策略 ,包括 前 
言 ` 后 记 、 脚 注 ,文中 词汇 注释 等 ,尤为 重要 的 是 个 性 表达 方式 , 即 典型 的 语言 运用 
习惯 。 她 初步 分 析 的 结论 是 ,从 理论 上 识别 某 个 文学 译 者 的 文体 是 可 能 的 ,因而 有 
可 能 借助 此 类 描写 了 解 该 译 者 选择 再 现 的 世界 ,有 助 于 研究 者 将 语言 习惯 与 译 者 
的 社会 文化 处 境 ( 包 括 文化 间 的 关系 、 预 期 读者 等 ) 结 合 起 来 ,也 是 将 翻译 的 /语言 
的 研究 同 社会 的 /文化 的 研究 结合 起 来 。Baker 的 同事 Olohan(2004:153-167) 则 
通过 “个 体 译 者 的 缩 略 词 模式 调查 ”和 “应 用 关键 词 分 析 探 究 译 者 的 词汇 选择 ”两 个 
个 案 分 析 , 讨 论 了 译 者 文体 研究 的 具体 操作 。 她 指出 ,影响 译 者 文体 的 因素 包括 文 
化 中 介 的 需要 、 读 者 期 望 .意识 形态 以 及 编辑 与 修改 等 。Malmkjaer(2004) 以 H. 
W. Dulcken 对 Hans Christian Andersen 作品 的 英 译 为 例 ,对 译 者 文体 作 了 进 一 
步 探索 ,提出 了 “翻译 文体 学 ”(translation stylistics) 这 一 概念 。 她 关注 在 源 语文 本 
既定 条 件 下 , 译 者 为 什么 会 以 特定 的 方式 来 塑造 译文 ,对 这 些 现象 的 解释 除 考虑 语 
言 因 素 外 , 亦 可 从 语言 外 因素 ,如 翻译 规范 、 目 标语 文本 的 目的 等 人 手 。 这 是 国外 
学 者 的 一 些 探索 ,而 相关 的 涉及 汉语 的 英 译 汉 或 汉 译 英 的 翻译 文体 还 未 得 到 研究 ， 
也 是 留待 我 国学 界 探讨 的 课题 。 


5.5 ”应 用 层面 的 研究 课题 


语料库 的 兴起 带 来 研究 工具 和 研究 方法 的 更 新 ,进而 导致 语料库 语言 学 和 语 
料 库 翻译 学 的 产生 , 带 来 研究 范式 上 的 变化 和 研究 课题 的 丰富 。Labov(1975) 很 早 
以 前 就 指出 ,语言 学 研究 范式 的 每 一 次 重大 变化 都 源 于 对 于 该 领域 内 数据 看 法 的 
改变 ( 转 引 自 Stubbs 1993:24) ,这 一 点 也 适合 我 们 评价 语料库 翻译 学 。 语 料 库 资 
源 的 共享 ,检索 工具 的 不 断 研制 和 更 新 ,使 语言 和 翻译 的 研究 范围 从 语 际 对 比 扩大 
到 语 内 类 比 ,呈现 出 双向 ,多 重 的 对 比 模式 ,其 意义 不 仅 体现 在 理论 上 ,在 对 翻译 现 
象 (也 包括 双语 对 比 ) 的 描述 和 翻译 教学 的 改进 方面 也 极 有 应 用 价值 。 


5.5.1 翻译 应 用 研究 


基于 语料库 的 翻译 应 用 研究 主要 是 将 基于 规则 的 研究 方法 (rule-based 
approach) 同 基于 语 料 的 研究 方法 (corpus-based approach) 相 结合 ,为 自动 翻译 寻 
找 出 更 便利 可 行 的 途径 。 从 理论 上 说 ,翻译 记忆 就 是 一 种 双语 对 应 语料库 ,规模 足 
够 大 , 语 料 足够 丰富 ,标注 方便 实用 , 它 就 是 解决 自动 翻译 的 极 好 途径 ,是 一 个 极 有 - 
前 景 的 大 课题 。 实 际 上 ,目前 不 少 的 翻译 公司 也 在 尝试 以 双语 对 应 语料库 或 储存 
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的 已 译 语 料 作为 自动 翻译 的 辅助 工具 。 
5.5.2 ”翻译 教学 研究 与 实践 


另 一 个 重要 的 应 用 领域 就 是 翻译 教学 或 译员 培训 ,现在 有 不 少 研究 者 开始 探讨 
利用 双语 语料库 进行 辅助 翻译 教学 和 翻译 自主 学 习 的 探讨 。 双 语 对 应 语料库 辅助 翻 
译 教学 ,是 指 借助 大 规模 原文 及 其 对 应 译文 的 电子 文本 , 辅 以 计算 机 统计 手段 的 翻译 
教学 模式 。 这 一 模式 旨 在 从 翻译 产品 人 手 , 通 过 观摩 对比、 分 析 、 借 鉴 的 方式 发 挥 学 
生 的 主动 性 ,培养 学 生 的 翻译 意识 ,在 评估 他 人 译作 和 自我 实践 的 基础 上 提高 学 生 的 
翻译 技能 。 国 际 上 关于 利用 双语 对 应 语料库 提高 翻译 教学 的 研究 可 参看 Zanettin， 
F. ,S，Bernardini & D，Stewart(2003) 所 编 ( 翻 译 教育 中 的 语料库 》(Corpora in 
Translator Education ) 论 文集 ,其 中 不 少 论文 有 一 定 参 考 价值 。Bernardini(1997) 
指出 ,翻译 教学 辅 之 以 对 应 语料库 检索 ,便于 翻译 专业 学 生 形成 一 种 翻译 的 “ 意 
识 ”“ 反 射 " 和 “应 变 ”, 这 些 技能 “使 专业 译员 有 别 于 那些 不 熟练 的 业余 爱好 者 ”。 
利用 平行 对 应 语料库 ( 配 以 合适 的 检索 工具 ) 便 于 查找 特定 表达 方式 的 译 法 ,使 术 
语 和 短语 的 翻译 更 加 准确 、 地 道 ,而 且 常常 可 以 提供 多 个 翻译 选择 或 翻译 参考 , 比 
双语 词典 的 例证 更 为 丰富 ,更 为 真实 。 

至 于 翻译 自主 学 习 , 双 语 对 应 语料库 无 疑 是 很 好 的 工具 。Monz6(2003) 指 出 ， 
要 让 翻译 学 习 者 认识 翻译 ,最 好 的 办 法 就 是 让 他 们 置身 其 中 (exposure) ,而 双语 库 
是 创造 此 种 翻译 环境 的 一 条 途径 ,因为 通过 双语 平行 语 料 , 不 仅 能 让 学 生 直接 观察 
原 语 语言 系统 的 规则 ,也 能 看 到 翻译 文本 的 自身 特征 ,建立 对 翻译 转换 的 感性 认 
We EIIE , 秦 洪 武王 海 霞 (2007) 的 一 项 基于 语料库 的 翻译 自主 学 习 实 验 也 表 
明 , 语 料 库 和 语 料 分 析 工 具 为 发 现 式 学 习 活 动 提供 了 有 力 的 辅助 工具 , 它 能 激发 学 
生 的 兴趣 ,促使 学 生 将 注意 力 集中 在 意义 和 形式 的 关联 上 ,提供 轻松 的 课堂 互动 环 
境 。 从 外 语 学 习 和 翻译 技巧 觉 识 上 看 ,学 习 者 通过 观察 双语 对 应 语 料 可 能 对 搭配 、 
语义 偏向 和 语义 前 等 现象 更 加 敏感 ;翻译 技巧 和 策略 可 以 通过 学 生 之 间 和 师 生 之 
间 的 互动 性 讨论 逐步 形成 ,这 有 助 于 学 生 形 成 稳定 .持久 和 灵活 的 翻译 策略 ,而 单 
靠 教师 课堂 传授 翻译 技巧 很 难 做 到 这 一 点 。 


5.6 小 结 


由 上 述 可 知 ,语料库 翻译 学 方兴未艾 ,新 课题 新 探讨 层出不穷 。 语 料 库 的 兴起 
带 来 研究 工具 和 研究 方法 的 更 新 ,进而 导致 语料库 语言 学 和 语料库 翻译 学 的 产生 ， 
带 来 研究 范式 上 的 变化 和 研究 课题 的 丰富 。 在 描写 研究 .应 用 研究 和 理论 研究 三 
大 方面 ,语料库 翻译 学 都 大 有 可 为 。 目 前 国内 外 学 者 们 纷纷 创建 和 研制 各 种 语 料 
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库 , 并 开展 各 具 特 色 的 研究 ,大 大 丰富 了 学 界 对 翻译 的 认识 ,推进 了 学 术 的 进步 。 
无 论 是 基于 语料库 还 是 为 语料库 所 驱动 的 研究 ,都 为 研究 者 带 来 不 少 新 的 课题 ,从 
而 吸引 更 多 的 研究 人 员 , 并 有 可 能 突破 原来 的 研究 局 面 , 带 来 新 的 启示 和 进展 。 在 
这 个 意义 上 可 以 说 语料库 翻译 学 代表 了 一 种 新 的 研究 范式 。 


翻译 共性 研究 及 其 反思 


语料库 方法 应 用 于 翻译 研究 推动 了 对 翻译 共性 的 研究 ,但 翻译 共性 研究 早 在 
语料库 方法 介入 之 前 就 已 开始 。 本 章 追 述 这 一 研究 的 历程 及 主要 研究 成 果 , 同 时 
论 及 目前 对 此 论说 的 质疑 ,指出 以 Mona Baker 为 代表 的 基于 语料库 的 翻译 共性 研 
究 在 研究 对 象 的 界定 和 方法 论 方面 的 确 存在 一 些 问题 ,提出 对 翻译 共性 的 研究 不 
应 仅仅 局 限于 翻译 过 程 本 身 , 还 应 当 从 具体 语言 对 、 翻 译 方向 、 译 者 因素 、 文 体 类 型 
等 多 个 视角 进行 。 


6.1 引言 


人 们 往往 对 翻译 文本 抱 有 一 些 偏见 , 究 其 根源 在 于 翻译 文本 中 使 用 的 语言 ,这 
种 特殊 的 语言 变 体 向 来 被 冠 以 “翻译 体 ”(translationese) 的 “恶名 。 对 翻译 语言 本 
身 特征 的 关注 可 以 追溯 到 20 世纪 六 ,七 十 年 代 。Even-Zohar(1978) 指 出 ,在 翻译 
中 “我 们 可 以 发 现 一 些 语言 模式 , 既 不 能 根据 原 语言 语 库 , 也 无 法 按照 目标 语言 语 
库 来 加 以 解释 "(Hatim 2001:152)。Duff(1981) 将 这 种 听 起 来 像 “外 ” 语 的 翻译 语 
言 视 为 “第 三 类 语言 ">(the third language) ,Frawley(1984) 称 其 为 第 三 类 语 码 (the 
third code) 。 翻 译 体 与 第 三 类 语 码 常 被 混用 ,但 两 者 有 差别 ,前 者 是 偏离 目标 语 规 
范 的 极端 形式 (Shuttleworth & Cowie 2004:188) ,而 后 者 则 是 翻译 共性 研究 的 数 
据 来 源 。 

20 世纪 90 年 代 以 来 ,新 型 翻译 语料库 所 拥有 的 大 规模 原文 和 译文 文本 语 料 
与 相关 计算 机 分 析 技 术 结合 所 产生 的 数据 为 翻译 研究 提供 了 新 视角 ,基于 语料库 
的 翻译 研究 方法 应 运 而 生 , 经 过 十 多 年 的 理论 阐述 与 实证 研究 已 经 发 展 成 为 一 种 
新 研究 范式 。 其 研究 范围 覆盖 了 从 翻译 过 程 到 产品 的 各 种 翻译 现象 ,特别 是 翻译 
语言 普遍 特征 、 翻 译 过 程 、 翻 译 转换 与 规范 、 译 者 文体 等 方面 。 这 些 领域 中 又 以 对 
翻译 共性 的 研究 最 为 突出 。 
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6.2 翻译 共性 的 概念 


翻译 共性 (translation universals) , 亦 称 翻 译 普遍 特征 或 翻译 共性 O, Baker 
(1993:243) 将 其 定义 为 “翻译 文本 而 不 是 原 话语 中 出 现 的 典型 语言 特征 ,并 且 这 
些 特 征 不 是 特定 语言 系统 干扰 的 结果 ”@, 即 指 翻译 语言 作为 一 种 客观 存在 的 语 
言 变 体 , 相 对 于 目标 语 原创 语言 ,在 整体 上 表现 出 来 的 一 些 规律 特征 。 这 一 定义 
有 两 重 含义 :第 一 ,翻译 共性 是 特定 语言 模式 的 概率 性 分 布 特征 , 主要 在 归纳 的 
基础 上 获得 ;第 二 ,翻译 共性 由 翻译 过 程 本 身 造成 ,与 两 种 语言 系统 之 间 的 差异 
无 关 。 

Chesterman(2004a,2004b) 将 翻译 共性 划分 为 两 大 类 : 源 语 型 共性 (S-universals) 
和 目标 语 型 共性 (T-universals) ,前 者 是 基于 源 文本 与 译文 之 间 的 关系 ,关注 译 者 
对 源 语文 本 的 处 理 方式 ;后 者 是 关于 目标 语 中 翻译 文本 与 原创 文本 之 间 的 关系 , 重 
点 放 在 译 者 对 目标 语 语言 的 处 理 方式 上 。Baker(1993:243) 所 谓 的 “翻译 普遍 特 
征 ”"(universal features of translation) 即 属于 后 一 类 ,她 将 其 定义 为 “翻译 文本 而 不 
是 原 话语 中 出 现 的 典型 语言 特征 ,并 且 这 些 特征 不 是 特定 语言 系统 干扰 的 结果 ”。 
柯 飞 (2005) 所 提出 的 “翻译 共性 ” 则 属于 前 者 ,是 指 “ 译 文中 呈现 的 有 别 于 原文 的 一 
些 典 型 的 、 跨 语言 的 .有 一 定 共性 的 特征 ”。 

Baker 在 前 人 研究 成 果 (Blum-Kulka 1986; Toury 1980,1991; Vanderauwera 
1985;Shlesinger 1991 等 ) 的 基础 上 ,首先 提出 了 基于 语料库 的 “翻译 普遍 特征 ”的 
假设 ,包括 六 个 方面 :1) 译 文 显 化 程度 显著 提高 ;2) 消 歧 和 简化 ;3) 合 平 语法 性 ;4) 
避免 重复 ;5) 超 额 再 现 目标 语 语言 特征 ;6) 翻 译 过 程 往往 会 导致 某 些 语言 特征 表现 
出 特定 的 分 布 类 型 (同上 :243-245)。 随 后 ,在 此 基础 上 的 翻译 共性 研究 不 断 深入 、 
细 化 ,逐步 形成 了 一 整套 方法 论 。 然 而 ,其 中 一 些 个 案 研 究 的 结果 却 与 共性 假设 或 
多 或 少 有 些 出 人 ,由 此 引发 了 关于 翻译 共性 存在 与 否 的 讨论 。2001 年 在 丹麦 哥 本 


四 ”翻译 共性 指 “ 译 文中 呈现 的 有 别 于 原文 的 一 些 典型 的 、 跨 语言 的 ,有 一 定 普遍 性 的 特 
征 ”( 柯 飞 2005). 

© EAM Baker 的 原文 ,翻译 普遍 特征 是 指 "features which typically occur in translated text 
rather than original utterances and which are not the result of interference from specific linguistic 
systems. ”(Baker 1993:243) 
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哈 根 和 芬兰 萨 翁 林 纳 分 别 举行 的 两 次 会 议 Q 上 ,与 会 者 就 这 一 话题 进行 了 深信 
探讨 。 

在 对 假设 进行 验证 和 阐述 的 过 程 中 , Baker 的 翻译 普遍 特征 被 归纳 为 简化 
Csimplification)、 显 化 (explicitation) 和 范 化 (normalization) 三 个 方面 @。 因 为 基于 
语料库 的 翻译 共性 研究 离 不 开 对 前 人 研究 成 果 的 传承 ,我 们 参照 Laviosa(2002) 和 
Olohan(2004) 的 做 法 ,以 Baker(1993:233-250) 的 “语料库 语言 学 和 翻译 研究 :启示 
与 应 用 ”一 文 为 界 , 将 翻译 共性 研究 划分 为 前 语料库 (pre-corpus) 和 基于 语料库 
《corpus-based) 的 两 个 时 期 加 以 评述 。 


6.3 前 语料库 时 期 的 翻译 共性 研究 


Bernardini & Zanettin(2004) 认 为 基于 语料库 的 翻译 共性 研究 存在 的 问题 主 
要 表现 在 对 共性 概念 的 界定 和 所 采用 的 方法 论 两 方面 。 关 注 的 对 象 不 同 , 所 采用 
的 研究 模式 就 会 有 差异 。 在 翻译 共性 研究 中 存在 两 种 对 比 模式 :1) 原 文 文本 与 译文 
文本 的 语 际 对 比 模式 ;2) 目标 语 中 译文 文本 与 原创 文本 的 语 内 类 比 模式 。 早 期 对 翻 
译 共 性 的 关注 ,主要 是 从 语 际 对 比 的 角度 出 发 ,代表 性 研究 有 Vinay & Darbelnet 
(1958), Nida (1964, 1969), Blum-Kulka & Levenston (1983), Vanderauwera 
(1985) , Blum-Kulka(1986) , Toury(1980,1991) ,Shlesinger(1991)%, 

语料库 用 于 翻译 研究 可 以 追溯 到 80 年 代 (Laviosa 2002:1,21) ,但 当时 文本 采 
集 的 规模 通常 较 小 ,并 且 多 以 手工 统计 为 主 。 这 里 所 谓 “ 前 语料库 时 期 ”就 是 指 大 
规模 机 读 翻 译文 本 用 于 翻译 研究 之 前 ,通过 人 工 采 集 原文 与 译文 文本 ,并 对 与 翻译 
有 关 的 语言 现象 进行 人 为 对 比 ,分 析 和 统计 的 时 期 。 这 一 时 期 的 翻译 共性 研究 主 
要 表现 为 从 词汇 ,句法 和 文体 等 角度 关注 简化 、 显 化 和 范 化 三 方面 问题 。 

翻译 共性 研究 中 所 谓 的 简化 ,是 指 译 者 在 目标 语文 本 中 对 原 语文 本 中 的 “语言 / 
信息 /语言 和 信息 下 意识 地 简单 化 ”(Baker 1996:176) 处 理 的 倾向 。Blum-Kulka & 


中 ”两 次 会 议 分 别 为 :1)2001 年 8 一 9 月 于 丹麦 哥本哈根 举行 的 第 三 届 EST 大 会 ,议程 中 
包括 关于 普遍 性 问题 的 小 组 讨论 ,部 分 论文 收录 于 Hansen, Gyde, Kirsten Malmkjær and Daniel 
Gile (eds. ). 2004, Claims, Changes and Challenges in Translation Studies. Selected Contributions 
for the EST Congress, Copenhagen, 2001. Amsterdam; John Benjamins Publishing Company; 
2)2001 年 10 月 于 芬兰 萨 欧 林 纳 (Savonlinna) 举 行 的 关于 翻译 普遍 性 研究 的 大 会 ,主要 论文 收录 
于 Mauranen, Anna and Pekka Kujamæki (eds. ). 2004. Translation Universals: Do They Exist? 
Amsterdam; John Benjamins, 

O ”对 翻译 普遍 性 特征 包含 的 具体 内 容 目 前 尚未 有 完全 统一 的 看 法 ,但 相关 理论 阐述 与 实 
证 性 研究 主要 集中 于 这 三 个 方面 。 
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Levenston(1983:119) 将 翻译 中 的 词汇 简化 (lexical simplification) 定 义 为 “用 少量 
的 词 处 理 原文 的 过 程 和 /或 结果 ”。 语 料 库 翻译 研究 途径 正式 提出 之 前 对 简化 现象 
的 探讨 主要 有 Blum-Kulka & Levenston (1983)、Vanderauwera (1985)、 Baker 
《1992) 等 ,内 容 主要 涉及 对 词汇 句法 和 文体 的 简化 ,又 可 分 为 由 两 种 语言 系统 差 
异 所 造成 的 强制 性 简化 ,和 由 翻译 过 程 本 身 、 译 者 偏好 、 目 标语 语文 规范 等 因素 造 
成 的 非 强制 性 简化 两 大 类 四 。Blum-Kulka & Levenston 所 提出 的 五 项 策略 @ 中 ， 
除 两 项 外 其 他 均 属 前 者 , 与 下 文 基于 语料库 的 简化 研究 不 同 。Vanderauwera 的 研 
究 可 以 说 具备 了 语料库 翻译 共性 研究 的 雏形 ,她 所 论 及 的 简化 手段 大 都 属于 非 强 
制 性 简化 的 范畴 ,但 在 讨论 中 句法 与 文体 之 间 的 界限 不 甚 清楚 ,总 体 上 看 只 是 翻译 
实践 中 译 者 遵循 目标 语 语言 使 用 规范 的 一 些 归 化 手法 。 

显 化 的 概念 最 早 由 Vinay 和 Darbelnet(1958) 作 为 一 种 文体 翻译 技巧 提出 ,是 
指 将 原 语 中 隐 含 的 信息 在 目标 语 中 加 以 明示 ,此 类 信息 在 原文 本 中 可 以 根据 语 境 
或 情境 获得 (1958/1995:342)。 在 语料库 翻译 方法 提出 之 前 ,有 关 显 化 的 研究 主要 
有 Vinay & Darbelnet (1958), Nida (1964, 1969), Vanderauwera (1985) , Blum- 
Kulka(1986) ,Klaudy(1998)4§, Vinay 和 Darbelnet 是 从 对 比 文体 的 角度 提出 这 
一 概念 的 ,他 们 将 显 化 和 隐 化 视 为 一 组 对 立 的 文体 翻译 技巧 , 常 与 信息 的 获得 与 损 
失 相 联系 。 所 涉及 的 显 化 包括 词汇 显 化 和 信息 显 化 两 种 ,这 两 类 显 化 表面 上 都 是 
语 境 或 情境 要 求 的 结果 ,但 从 本 质 上 讲 依然 是 语言 系统 差异 造成 的 ,属于 强制 性 显 
化 的 范畴 。Nida(1969:164-5) 指 出 好 的 译文 往往 多 少 会 比 原文 长 ,主要 是 因为 在 
翻译 过 程 中 , 译 者 会 通过 明示 原文 中 的 含蓄 信息 在 适当 限度 内 增加 译文 的 元 余 度 。 
他 主要 是 从 语言 文化 差异 和 方便 译文 接受 者 理解 原作 的 角度 来 探讨 翻译 中 的 新 信 
息 现象 。Vanderauwera 指出 了 译 者 所 采用 的 各 种 显 化 技巧 ,这 些 技巧 均 不 在 语言 
系统 差异 影响 之 列 , 但 与 译 者 的 个 人 文体 偏好 不 无 关系 ,这 在 一 定 程度 上 为 后 来 用 
语料库 研究 译 者 的 文体 奠定 了 基础 。Blum-Kulka 从 翻译 中 衔接 与 连贯 的 转换 入 
手提 出 了 显 化 假设 (the explicitation hypothesis) :翻译 过 程 会 使 译文 相对 于 原文 
更 加 元 长 ,其 表现 形式 为 衔接 方式 的 显 化 程度 提高 (1986 :19)。 这 一 假设 有 两 个 特 
点 :第 一 ,将 显 化 视 为 翻译 过 程 内 在 的 属性 ,摆脱 了 语言 系统 差异 的 影响 ,使 显 化 研 


® Kinga Klaudy 在 讨论 显 化 时 ,将 其 分 为 四 类 :强制 性 显 化 、 非 强制 性 显 化 , 语 用 显 化 和 翻 
译 内 在 显 化 (Baker 2004:82-83) ,其 中 非 强制 性 显 化 的 部 分 内 容 和 翻译 内 在 显 化 属于 语料库 翻 
译 普遍 性 探讨 的 范围 ,此 处 借用 Klaudy 的 说 法 。 

®@ Laviosa 在 其 “Universals of translations” (Baker (ed. ) 2004:288) 一 文中 似乎 将 Blum- 
Kulka 8. Levenston(1983) 中 的 简化 策略 分 为 六 类 , 原作 中 实际 分 为 五 类 (Blum-Kulka & 
Levenston 1983:126-36) 。 
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究 具体 化 ;第 二 ,从 句法 的 非 强制 性 转换 入 手 ,将 译 者 的 文体 偏好 作为 参数 之 一 。 
Blum-Kulka 的 论断 为 后 来 基于 语料库 的 翻译 共性 研究 提供 了 重要 思路 。Klaudy 
(1998) 将 显 化 分 成 强制 性 显 化 、 非 强制 性 显 化 . 语 用 显 化 和 翻译 内 在 显 化 四 类 
(Baker 2004:82-83), 各 类 之 间 尽 管 存在 一 定 程 度 的 重合 , 却 让 我 们 认识 到 显 化 现 
象 的 多 样 性 和 多 层次 性 ,在 此 基础 上 能 对 翻译 共性 做 出 更 加 全 面 的 认识 。 

范 化 是 指 “ 遵 循 ,甚至 于 夸大 目标 语 中 典型 的 模式 和 做 法 的 倾向 ”(Baker 
1996:176-177)。Vanderauwera(1985) 和 Toury(1995) 是 前 语料库 时 期 范 化 研究 
的 主要 代表 。Vanderauwera 发 现 译文 语 篇 在 标点 、 选 词 ,文体 .句子 结构 以 及 语 篇 
构建 方面 的 转换 均 趋 向 于 目标 语 语言 传统 规范 的 特点 (Laviosa 2002:55), Toury 
从 描写 翻译 研究 的 途径 入 手提 出 的 标准 化 (standardization) 法 则 既 有 语 际 转换 基 
础 上 对 比 ,也 包括 目标 语 内 翻译 文本 与 原创 文本 的 比较 (Paloposki 2001), 这样 的 
论断 拓宽 了 翻译 共性 研究 的 视角 ,并 且 为 进一步 对 翻译 共性 进行 解释 提供 了 多 重 
角度 。 

相对 于 基于 语料库 的 方法 ,前 语料库 时 期 的 翻译 共性 研究 除 具有 Laviosa 
(2002:57-58) 所 提出 的 五 个 特点 外 ,还 表现 出 :1) 每 个 研究 都 是 从 各 自 不 同 视角 ， 
如 对 比 语言 学 ,文体 学 或 翻译 研究 的 角度 出 发 ,在 对 个 别 概念 的 认识 上 存在 一 定 的 
偏差 ;2) 在 关注 焦点 上 ,词汇 、 句 法 ,文体 等 层面 均 有 涉及 ,但 缺乏 统一 的 指导 原则 ; 
3) 对 共性 的 研究 主要 以 语 际 转换 为 基础 , 即 相对 原 语 而 言 译 语 的 普遍 特征 。 尽 管 
如 此 ,这 些 前 期 研究 为 以 后 基于 语料库 的 翻译 共性 研究 莫 定 了 基础 。 


6.4 基于 语料库 的 翻译 共性 研究 


自 Baker(1993) 提 出 基于 语料库 的 翻译 普遍 特征 研究 以 来 , 近 十 多 年 围绕 这 一 
主题 的 研究 大 量 涌现 , 具 代表 性 的 主要 有 Baker(1993,1995,1996)、Laviosa(1997， 
1998a, 1998b,)、Kenny(1998, 2001)、Overas(1998) 、Olohan & Baker (2000)、 
Mauranen(2000, 2004) , Puurtinen(1998, 2003a, 2003b) , Tirkkonen-Condit (2000, 
2002, 2004) ,Englund-Dimitrova(2003) , Frankenberg-Gacia (2004) , Klaudy(1998, 
2001 ,2003) ,Kenny(1999,2001, 2005) ,Johansson(2004) , £ FEJE (2003) 、 秦 洪武 和 
王 克 非 (2004)、 贺 显 研 (2003)、 柯 飞 (2003,2005) 等 。 这 些 研 究 的 主要 内 容 是 对 简 
化 、 显 化 和 范 化 等 普遍 特征 在 各 语种 大 型 双语 语料库 中 的 实证 检验 。 这 些 研究 的 
结果 既 有 对 原 共 性 假说 的 支持 ,也 有 质疑 ,同时 还 有 新 的 假说 提出 。 

Laviosa(2002:58-59) 指 出 :Baker 关于 简化 的 研究 有 三 个 特点 :第 一 ,翻译 共 
性 是 翻译 过 程 本 身 内 在 的 特征 ;第 二 ,共性 研究 所 采纳 的 是 翻译 产品 /目标 语 取 向 
(product-/target-oriented) 的 视角 和 基于 语料库 的 方法 ;第 三 , 以 类 比 语料库 
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《comparable corpora) 作 为 语 料 数据 来 源 。 这 三 个 方面 也 是 语料库 翻译 共性 研究 
不 同 于 前 语料库 时 期 相关 研究 的 主要 所 在 ,Baker 的 思想 仍 是 这 一 研究 途径 方法 
论 的 基础 。 其 中 Laviosa 对 简化 (1998b) 以 及 核心 词汇 模式 (1998a) 的 分 析 将 共性 
研究 完全 局 限 在 目标 语 语 言 环境 内 ,树立 了 共性 研究 的 单 语 类 比 语料库 研究 模式 
(monolingual comparable corpus-based model) ,尽管 这 一 模式 打破 了 传统 上 原 语 
语 篇 的 主宰 地 位 和 对 等 的 观念 ,但 在 客观 上 也 造成 了 排除 原 语文 本 的 做 法 ,缺少 了 
对 共性 现象 进行 充分 解释 的 一 个 维度 (Kenny 2005; Bernardini 2005), 
Kenny(2005) 还 特别 指出 对 应 语料库 的 运用 并 不 是 要 重新 回 到 原 语 与 译 语文 
本 二 元 对 立 的 老 问 题 上 去 ,而 是 要 探究 如 何在 单 语 类 比 语料库 研究 范式 的 基础 上 ， 
进一步 通过 对 应 语料库 来 完善 翻译 普遍 现象 研究 的 综合 法 。Overas(1998) 则 以 英 
语 -挪威 语 平行 语料库 为 基础 ,重新 从 句法 角度 在 语 篇 衔接 层面 上 考察 显 化 ,从 而 
将 前 语料库 时 期 的 研究 途径 与 基于 语料库 的 方法 结合 在 一 起 。Olohan & Baker 
对 非 强制 性 关系 词 that 在 原创 英语 与 翻译 英语 中 使 用 的 研究 虽 都 表明 显 化 是 语 
言 转换 中 的 一 个 普遍 倾向 (Olohan 2004:93-97) ,但 其 采用 的 依然 是 单 语 类 比 语 料 
库 的 研究 模式 ,而 且 此 类 语言 现象 仅 局 限于 英语 ,因此 只 是 对 翻译 共性 一 个 间接 的 
证 明 。Mauranen、Puurtinen 和 Tirkkonen-Condit 等 在 翻译 芬兰 语 语料库 (Corpus 
of Translated Finnish) 基 础 上 对 翻译 芬兰 语 的 研究 结果 不 仅 有 对 翻译 共性 的 支 
持 , 同 时 也 包括 对 现 有 翻译 共性 的 质疑 和 挑战 ,为 这 一 研究 提出 了 一 些 新 问题 。 柯 
飞 以 汉 英 对 应 语料库 0 为 基础 ,分 别 从 宏观 和 微观 角度 对 显 化 进行 了 验证 和 探讨 ， 
并 特别 指出 :“ 作 为 一 种 翻译 现象 , 显 化 (以 及 隐 化 ) 不 应 只 是 狭义 地 指 语言 衔接 形 
式 上 的 变化 ,还 应 包括 意义 上 的 显 化 转换 , 即 在 译文 中 添加 了 有 助 于 译文 读者 理解 
的 显 化 表达 ,或 者 说 将 原文 隐 含 的 信息 显 化 于 译文 中 ,使 意思 更 明确 ,逻辑 更 清楚 ” 
(2005 ;306). 
Englund-Dimitrova(2003) 通 过 有 声 思维 法 和 书写 过 程 的 计算 机 记录 等 手段 ， 
对 俄语 -瑞典 语 翻 译 中 转折 连词 在 译文 中 显 化 与 否 进行 了 考察 ,各 项 数据 表明 : 翻 
译 中 的 显 化 与 译 者 的 翻译 经 验 有 关 , 职 业 译 者 往往 对 显 化 策略 的 使 用 要 比 学 生 译 
者 多 。 这 一 研究 从 社会 文化 的 视角 指出 , 显 化 是 俄 - 瑞 翻 译 中 职业 译 者 所 遵循 的 一 
种 翻译 规范 。Frankenberg-Gacia(2004) 以 葡 - 英 双向 平行 语料库 (Compara) 为 基 
础 ,从 译文 与 原文 文本 长 度 角度 探讨 了 非 强制 显 化 。 该 研究 以 定量 分 析 的 方法 证 
明了 翻译 文本 中 词汇 数量 的 整体 增加 表明 译文 往往 比 原文 更 为 明晰 ,而 且 这 并 不 
受制 于 两 种 语言 之 间 的 差异 。 这 些 研究 ,特别 是 翻译 芬兰 语 语料库 和 汉 英 /英汉 平 


O 该 语料库 由 北京 外 国语 大 学 中 国外 语 教育 研究 中 心 研制 ,具体 内 容 参 见 ; 王 克 非 等 ， 
2004,《 双 语 对 应 语料库 :研制 与 应 用 ?。 
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行 语料库 基础 上 的 研究 ,将 翻译 共性 延伸 到 了 印 欧 语系 以 外 的 翻译 研究 中 。 

总 的 说 来 ,基于 语料库 的 共性 研究 呈现 出 四 个 特点 :1) 大 多 数 研究 都 是 以 共 时 
语 料 为 研究 对 象 ,主要 依靠 计算 机 技术 分 析 数 据 , 如 平均 句子 长 度 、 形 符 / 类 符 比 
率 .词汇 密度 等 手段 对 词汇 多 样 性 、 信 息 负 载 度 等 方面 进行 考察 ;2) 以 对 共性 的 验 
证 和 描写 为 主 ,解释 较 少 ;3) 理 论 阐述 与 实证 研究 相 结 合 ;4) 主要 以 单 语 类 比 语 料 
库 为 基础 ,探究 相对 于 目标 语 原 创 文本 而 言 的 翻译 文本 特征 。 这 项 研究 总 体 上 经 
历 了 一 个 由 单 语 类 比 语料库 范式 向 单 双语 结合 语料库 (包括 单 语 参照 库 和 双语 对 
应 库 ) 综 合法 发 展 的 过 程 ,研究 内 容 由 词汇 向 句法 、 语 篇 层次 进行 延伸 ,宏观 与 微 
观 ,理论 阑 述 与 实证 性 研究 并 举 。 

针对 Olohan & Baker(2000) 采 用 的 类 比 模式 ,Kenny(2005) 以 德 英文 学 文本 
平行 语料库 对 非 强制 性 that 研究 的 结果 重新 验证 后 指出 :英语 译 者 在 say 之 后 使 
用 非 强制 性 zhat 的 大 多 数 情况 并 非 为 了 去 对 应 德语 中 的 dap, 表 面 上 属于 语法 显 
化 ,但 原 语文 本 中 可 能 还 使 用 了 除 dap 以 外 的 其 他 连接 词 形式 来 明示 从 句 的 叙述 
性 质 ,因而 很 难 绝对 地 说 英语 译文 中 包含 ihat 的 做 法 全 都 属于 显 化 。Kenny 还 特 
别 指出 ,平行 语料库 的 运用 并 不 是 要 重新 回 到 原 语文 本 与 译 语文 本 二 元 对 立 的 老 
问题 上 去 ,而 是 要 探究 如 何在 单 语 类 比 语料库 研究 范式 的 基础 上 ,进一步 通过 平行 
语料库 来 完善 翻译 共性 研究 的 综合 法 (同上 ) 。 

翻译 共性 存在 一 定 的 层次 性 和 复杂 性 ,研究 的 首要 问题 是 对 研究 对 象 加 以 明 
确 界定 ,其 次 应 根据 综合 的 原则 ,采取 将 单 语 语 内 类 比 同 双语 语 际 对 比 相 结合 的 方 
法 ,提高 研究 结果 的 信 度 。 


6.5 ”翻译 共性 研究 存在 的 问题 


由 上 述 可 以 发 现 ,翻译 共性 研究 目前 依然 处 于 对 假设 的 验证 阶段 ,学 者 们 就 现 
有 假设 的 共性 (hypothesized universals) 尚 未 达成 共识 ,对 一 些 潜在 共性 (potential 
universals) 探 索 也 在 进行 当中 。 那 么 翻译 共性 果然 存在 吗 ? 若 存在 ， 是 以 何 种 形 
式 存在 ? 我 们 首先 看 一 看 对 翻译 共性 的 一 些 质 疑 ,然后 对 产生 问题 的 原因 加 以 
分 析 。 

对 翻译 共性 的 质疑 主要 表现 在 三 方面 :第 一 ,对 方法 论 的 质疑 。 面 对 翻译 共性 
研究 中 单 语 类 比 语料库 (monolingual comparable corpus) 的 传统 范式 ， Kenny 最 先 
将 平行 语料库 引入 翻译 共性 研究 中 (1998,2001) ,并 且 提出 如 何在 类 比 语料库 研究 
发 现 的 基础 之 上 开展 平行 语料库 研究 ,将 后 者 作为 前 者 的 补充 研究 (2005:157) ,以 
弥补 翻译 现象 研究 中 因 忽 略 原 语文 本 而 造成 的 缺陷 。 针 对 Olohan & Baker(2000) 
采用 的 类 比 语料库 方法 ,Kenny 以 一 个 德 英文 学 文本 平行 语料库 对 其 研究 结果 进 
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行 重新 验证 后 指出 :英语 译 者 在 say 之 后 使 用 非 强制 性 that 的 大 多 数 情 况 并 非 为 
了 去 对 应 德语 中 的 da8, 乍 看 起 来 属于 语法 上 的 显 化 ,但 还 需要 确认 一 下 原 语文 本 
中 是 否 使 用 了 除 dap 以 外 的 其 他 连接 词 形式 来 明示 从 句 的 叙述 性 质 , 如 果 有 的 话 ， 
就 很 难 断 定 英语 译文 中 包含 that 的 做 法 全 都 属于 显 化 的 现象 (Kenny 2005:161)。 
由 此 可 以 看 出 ,部 分 基于 单 语 类 比 语料库 研究 范式 的 翻译 共性 研究 结果 在 方法 上 
有 待 于 平行 语料库 研究 的 进一步 验证 和 补充 。Bernardini(2005:6) 也 指出 ,“ 正 是 
翻译 作为 沟通 媒介 的 本 质 ,使 得 翻译 分 析 中 所 使 用 的 唯 目标 语 取向 的 方法 在 方法 
论 上 值得 怀疑 ”例如 类 比 语料库 设计 中 由 于 不 平衡 性 所 造成 的 可 比 性 缺乏 (lack 
of comparability) 问 题 。 可 见 ,方法 论 上 的 缺陷 是 造成 问题 的 根本 原因 之 一 。 

第 二 ,一 些 实证 性 个 案 研究 的 结果 与 共性 假设 相 背 离 。Puurtinen (1998, 
2003a,2003b) 以 芬兰 语 类 比 语料库 为 基础 ,从 句法 角度 将 芬兰 语 翻译 儿童 文学 中 
非 限定 性 结构 作为 衡量 可 读 性 的 标准 之 一 ,对 翻译 芬兰 语 的 语言 特征 以 及 意识 形 
态 规范 进行 考察 。 她 发 现 原创 芬兰 语 作品 中 非 限定 性 结构 的 出 现 频次 低 ,而 译 自 
英语 的 翻译 作品 中 , 非 限 定性 结构 的 使 用 频次 明显 高 于 当代 原创 芬兰 语 作品 ,由 于 
非 限 定性 结构 的 使 用 降低 了 译文 的 明晰 度 , 增 大 了 词汇 密度 和 信息 负载 ,而 且 大 量 
的 非 限定 性 结构 背离 了 芬兰 语 原创 儿童 文学 的 语言 规范 ,这 一 发 现 显然 与 Baker 
等 所 提出 的 翻译 文本 的 显 化 相互 矛盾 。Laviosa 根据 自己 的 研究 (1998a,1998b) 也 
指出 ,通过 英语 类 比 语料库 所 发 现 的 简化 证 据 在 各 个 文本 类 型 中 的 表现 并 不 完全 
统一 (2002:77), 如 翻译 文本 中 平均 句子 长 度 在 新 闻 和 散文 两 类 文本 中 呈现 出 相反 
的 趋势 ,前 者 比 原创 新 闻 英语 短 ,而 后 者 明显 长 于 原创 散文 。 这 样 看 来 ,文体 类 型 
不 仅 是 简化 研究 中 的 一 个 变量 ,而 且 将 平均 句子 长 度 作为 简化 的 一 个 参数 还 有 待 
于 进一步 验证 。Kenny(2001) 以 德 英文 学 文本 平行 语料库 (GEPCOLT) 为 基础 对 
翻译 中 的 范 化 和 译 者 创造 性 进行 考察 发 现 ,在 翻译 中 词汇 范 化 现象 的 确 存 在 ,但 原 
语文 本 中 的 创造 性 词汇 在 大 多 数 情况 下 却 没 有 发 生 范 化 (2001:187、210)。 这 说 明 
对 范 化 现象 的 研究 还 是 不 能 完全 脱离 原 语 语 篇 的 因素 。Mauranen(2000) 对 翻译 
和 原创 芬兰 语 学 术 及 非 小 说 文本 的 考察 发 现 ,多 词语 符 列 (multi-word strings) 在 
翻译 文本 中 的 多 样 化 程度 高 于 其 在 原创 文本 中 的 程度 ,这 就 说 明 在 学 术 文本 翻译 
中 的 范 化 特征 并 不 明显 ,也 说 明 这 一 普遍 特征 还 会 受到 具体 文体 类 型 的 局 限 
(Puurtinen 2003a) 。Johansson(2004) 针 对 Jean-Claude Chevalier(1995) 提 出 的 译 
文通 常 选择 人 称 类 主语 (human subject) 的 倾向 是 简化 或 范 化 的 表现 这 一 观点 , 通 
过 英语 -挪威 语 平行 语料库 (ENPC) 对 英 译 挪 中 主语 选择 的 调查 发 现 : 绝 大 多 数 情 
况 下 ,译文 会 保留 原文 的 主语 形式 ,主语 类 型 的 改变 往往 由 两 种 语言 系统 之 间 在 结 
构 或 文体 上 的 差异 造成 。 以 上 这 些 个 案 研究 的 结果 或 多 或 少 地 表现 出 与 现 有 共性 
假设 的 矛盾 ,暴露 出 存在 的 一 些 问题 。 
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第 三 , 印 欧 语系 之 外 的 共性 研究 对 原 有 假设 的 挑战 。 印 欧 语系 以 外 的 翻译 共 
性 研究 不 仅 有 对 已 假设 共性 的 支持 ,还 包括 对 潜在 共性 的 进一步 探索 , 某 些 发 现 还 
对 原 有 的 假设 提出 了 挑战 。Tirkkonen-Condit(2000,2002,2004) 以 芬兰 语 类 比 语 
料 库 为 基础 在 探究 翻译 文本 与 原创 文本 之 间 是 否 存在 系统 的 差异 ,以 及 是 否 由 于 
翻译 过 程 造成 了 翻译 语言 与 原创 语言 的 差异 等 问题 时 , 提出 了 独特 项 假说 (the 
unique items hypothesis); 目标 语 语言 中 的 某 些 语言 项 /元 素 在 源 语 中 缺少 语言 对 
应 项 ,相对 于 原创 文本 而 言 ,此 类 语言 项 /元 素 在 翻译 文本 中 的 频次 低 。 也 就 是 说 ， 
如 果 将 目标 语 原创 语言 规范 视 为 常态 ,那么 翻译 语言 特征 通常 被 认为 是 对 常态 的 
偏离 (Tirkkonen-Condit 2002:209), 即 非 标准 化 或 非 范 化 ,这 一 点 与 “遵循 甚至 于 
夸大 目标 语 中 典型 模式 和 做 法 ”Baker 1996:176-177) 的 范 化 相 背 离 。 柯 飞 (2003) 
以 英汉 / 汉 英 平行 语料库 为 基础 对 汉语 中 的 特殊 句 式 “ 把 ”字句 在 英汉 转换 中 的 分 
布 特点 进行 考察 发 现 :1) 翻 译 汉 语 作品 中 的 “把 字句 要 比 原创 汉语 中 的 “把 ”字句 
频次 高 ;2) 文 学 类 作品 比 非 文学 类 作品 中 “把 ”字句 的 频次 高 ;3) 由 于 “把 ”字句 适 于 
表达 复杂 和 细微 的 意思 ,因此 把 字句 的 频次 说 明了 翻译 文本 中 显 化 现象 。 这 一 结 
果 又 与 Tirkkonen-Condit 的 独特 项 假说 形成 鲜明 对 比 。 柯 飞 (2005) 进 一 步 指出 : 
翻译 中 的 显 与 隐 和 是 共存 的 ,翻译 中 隐 、 显 现象 和 程度 可 能 与 语言 的 形式 化 程度 和 翻 
译 方向 相关 ,同时 还 会 受到 译 者 .社会 文化 和 文本 因素 的 影响 。 

产生 以 上 质疑 的 原因 主要 有 两 方面 :第 一 ,研究 对 象 的 界定 。Bernardini & 
Zanettin(2004) 认 为 基于 语料库 的 翻译 共性 研究 在 对 共性 概念 的 界定 和 所 采用 的 
方法 论 两 方面 存在 问题 。 以 Baker 为 代表 的 学 者 ,将 翻译 共性 的 研究 对 象 局 限于 
翻译 过 程 本 身 所 造成 的 、 翻 译文 本 相对 于 目标 语 内 原创 文本 而 表现 出 的 语言 特征 ， 
仅 以 单 语 类 比 语料库 方法 论 为 模式 ,使 得 实证 研究 中 语 内 类 比 和 语 际 对 比 所 造成 
的 两 大 类 翻译 共性 混杂 在 一 起 ;第 二 ,各 个 研究 中 对 各 种 变量 的 关注 与 控制 不 尽 一 
致 。 具 体 涉及 语言 对 、 翻 译 方向 , 译 者 因素 ,文体 类 型 等 多 种 因素 ,如 译 人 文本 与 译 
出 文本 的 差别 ,不 同文 体 类 型 文本 之 间 的 差别 都 是 影响 研究 结果 的 重要 因素 。 

基于 语料库 的 翻译 研究 方法 至 少 有 两 大 特点 :可 观察 性 (observability) 和 可 重 
复 性 (replicability) 。 这 一 研究 模式 面 对 的 是 实 实在 在 的 语 料 , 从 假设 出 发 ,在 各 种 
语言 中 不 断 加 以 验证 和 置疑 ,周而复始 ,使 得 研究 逐渐 深入 。 如 上 所 述 ,翻译 共性 
研究 中 各 种 变量 的 介入 ,加 上 翻译 共性 假设 本 身 在 概念 界定 和 方法 论 方面 存在 的 
问题 ,导致 了 个 别 实证 性 研究 对 翻译 共性 的 质疑 。 随 着 越 来 越 多 的 大 型 双语 语 料 
库 在 各 语种 中 的 建立 ,以 及 实证 性 研究 的 进一步 深入 ,需要 重新 界定 研究 对 象 ,发 
展 方法 论 , 在 更 加 充分 描写 的 基础 上 ,从 语言 . 认 知 和 社会 文化 等 视角 建立 一 套 系 
统 的 解释 和 预测 机 制 ,并 将 研究 结果 应 用 于 (或 验证 于 ) 翻 译 实践 和 翻译 教学 中 。 
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6.6 ”对 翻译 共性 研究 的 反思 


Baker(1993) 将 翻译 共性 定义 为 “翻译 文本 而 非 原 话语 中 出 现 的 典型 语言 特 
征 ,并 且 这 些 特征 不 是 特定 语言 系统 干扰 的 结果 ”。 这 一 定义 将 翻译 共性 局 限于 由 
翻译 过 程 本 身 造成 的 语言 特征 ,排除 了 语言 系统 差异 的 干扰 。 然 而 在 实际 操作 中 ， 
我 们 很 难 将 翻译 过 程 和 语言 系统 差异 这 两 个 因素 造成 的 共性 清楚 地 区 别 开 来 ,从 
而 造成 对 这 一 概念 认识 上 的 差异 。 其 次 ,Baker(1993) 所 倡导 的 类 上 比 语料库 基础 上 
翻译 语言 与 原创 语言 的 对 比 研究 莫 定 了 翻译 共性 研究 的 方法 论 基 础 ,但 在 翻译 研 
究 中 排除 原 语 文本 因素 的 做 法 本 身 就 值得 商 梭 。Bernardini(2005:6) 认 为 “ 正 是 翻 
译作 为 沟通 媒介 的 本 质 ,使 得 翻译 分 析 中 所 使 用 的 唯 目标 语 取向 的 方法 在 方法 论 
上 值得 怀疑 "。 甚 至 Baker 本 人 也 存在 自 相 矛 盾 的 地 方 : 她 一 方面 指出 翻译 普遍 特 
征 的 研究 主要 是 借助 类 符 - 形 符 比 率 (typetoken ratio) 和 词汇 密度 (lexical 
density) 等 手段 ,来 探究 译文 文本 相对 于 目标 语 原创 文本 而 体现 出 的 一 些 规律 性 语 
言 特征 (1995:235-238), 另 一 方面 ,在 讨论 显 化 ,简化 和 范 化 时 却 分 别 以 相对 于 原 
文 文本 的 文本 长 度 (text length)、 译 者 对 原作 标点 符号 的 改变 ,以 及 原 语文 本 及 语 
言 的 相对 社会 地 位 等 语 际 对 比 参数 作为 讨论 的 依据 (1996:180-184) 。 

可 见 , 对 共性 概念 的 界定 和 方法 论 的 选择 是 共性 研究 的 首要 问题 。Paloposki 
〈2001) 在 谈 及 简化 时 指出 :一 些 学 者 视 简化 为 语 际 转换 过 程 中 的 现象 ,而 另 一 些 学 
者 却 将 简化 研究 局 限于 翻译 语言 与 非 翻 译 语言 所 构成 的 单一 目标 语 语言 内 ,这 样 
一 来 ,尽管 讨论 的 都 是 翻译 共性 ,对 象 却 各 不 相同 ,在 方法 论 上 缺乏 一 定 的 统一 性 。 
针对 这 一 认识 上 的 混淆 ,Chesterman(2004a,2004b) 区 分 了 源 语 型 和 目标 语 型 两 类 
共性 。 可 见 ,不 同 的 视角 便 会 产生 出 对 翻译 共性 不 同 的 分 类 方法 ,如 绝对 的 /相对 
的 ; 语 际 的 / 语 内 的 ;强制 性 的 / 非 强制 性 的 ;语言 差异 造成 的 /翻译 过 程 造 成 的 ; 译 
者 的 有 意识 行为 /无 意识 行为 ;广义 的 /狭义 的 ;语言 形式 的 /语义 的 。 因 此 在 具体 
研究 首先 应 当 对 共性 的 概念 加 以 明确 界定 。 在 方法 论 方面 , 单 语 类 比 语料库 研究 
法 存在 明显 的 局 限 性 ,具体 表现 为 :1) 排 除 源 语文 本 而 孤立 的 讨论 翻译 问题 ;2) 目 
标语 内 翻译 文本 与 原创 文本 可 比 性 的 缺乏 ;3) 一 定 程度 上 忽略 了 对 翻译 方向 、 译 者 
因素 文体 类 型 等 各 种 变量 的 控制 ,导致 研究 结果 信 度 与 效 度 的 缺乏 。Mauranen 
& Kujamaeki(2004,Introduction) 指 出 :就 加 深 我 们 对 翻译 的 认识 而 言 ,共性 研究 
的 价值 在 于 从 与 共性 相关 的 认 知 、 社 会 和 语言 三 个 主要 领域 出 发 发 展 理论 ,积累 证 
据 , 因 此 没有 必要 在 方法 论 上 固守 任何 一 元 论 。 一 些 实证 性 研究 的 结果 (Overas . 
1998; Kenny 2001,2005; 柯 飞 2003,2005 等 ) 也 已 经 证 明 ,基于 语料库 的 共性 研究 
需要 打破 类 比 语料库 研究 模式 的 芍 断 ,重新 将 原 语 文本 因素 纳入 其 研究 的 视野 。 
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除 此 以 外 ,一 些 局 限 因 素 的 存在 也 是 造成 翻译 共性 研究 缺乏 统一 性 的 原因 。 
具体 表现 包括 :第 一 ,翻译 活动 内 在 的 不 对 称 性 。 如 Zanettin(2000) 的 研究 表明 ， 
以 意大利 语 出 版 的 图 书 中 翻译 作品 的 数量 远 远大 于 原创 作品 ,其 中 一 半 译 自 英语 ， 
而 以 英语 出 版 的 图 书 中 翻译 作品 所 占 的 比例 却 要 小 得 多 ,其 中 译 自 意大利 语 的 作 
品 还 不 足 5%。 而 且 两 种 翻译 作品 在 各 自 的 目标 语文 学 系统 中 所 享有 的 地 位 也 不 
相同 , 译 自 英语 的 意大利 语 作品 是 意大利 流行 小 说 的 主宰 形式 ,而 译 自 意大利 语 的 
英语 作品 在 英国 是 一 种 高 雅文 学 。 倘 若 从 翻译 作品 中 选择 意 - 英 双 向 平行 语料库 
的 语 料 , 它 们 就 缺乏 一 定 的 可 比 性 (Olohan,2004:47) 。 当 然 ,这 里 还 需要 对 两 种 翻 
译作 品 分 别 在 两 国内 的 读者 群 加 以 考察 ,本 章 在 此 限于 篇 幅 暂 不 作 深 究 。 尽 管 此 
类 问题 主要 存在 于 使 用 范围 较 窗 的 一 些小 语种 当中 ,但 在 此 类 语料库 基础 上 的 研 
究 结果 就 会 受到 影响 ;第 二 ,语言 对 的 局 限 。 每 种 语言 中 都 有 自己 独特 的 语言 表现 
形式 ,如 英语 中 的 非 强制 性 zhat\ 汉 语 中 的 “把 ”字句 、 芬 兰 语 中 表示 充足 性 的 动词 
ehtii(has enough time/is early enough or quick enough) 等 ,对 这 些 语言 项 的 分 析 
结果 只 能 是 对 共性 假说 部 分 的 支持 或 反对 ,需要 在 此 基础 上 做 进一步 的 归纳 ;第 
三 ,文体 类 型 的 局 限 。 根 据 Laviosa(1998a, 1998b) 的 研究 ,同样 为 叙述 性 文本 ,在 
散文 和 报刊 中 分 别 体现 出 的 普遍 特征 却 存在 一 定 的 差异 。 翻 译 共性 在 文学 文本 与 
学 术 性 , 非 小 说 文本 中 表现 也 不 尽 相同 。 这 些 都 说 明 共性 特征 也 会 受到 文 类 的 局 
限 。 由 此 可 见 , 对 翻译 共性 还 应 当 进一步 的 分 门 别 类 ,使 之 具体 化 ,并 在 各 汉语 体 
类 型 的 双语 平行 语料库 的 基础 上 重新 加 以 验证 。 


6.7 翻译 共性 研究 的 未 来 构想 


语料库 翻译 研究 范式 产生 前 后 ,翻译 共性 研究 在 内 容 上 既 包 括 语 际 转换 中 译 
文 相 对 于 原文 的 语言 特征 ,也 包括 目标 语 内 部 译文 文本 相对 于 原创 文本 的 语言 特 
征 ; 采 用 的 方法 包括 对 比分 析 、 单 语 类 比 语料库 模式 、 双 语 平行 语料库 模式 等 ;研究 
性 质 以 实证 性 描写 为 主 。 由 于 基于 语料库 的 翻译 共性 研究 最 初 主要 在 以 英语 为 主 
的 印 欧 语系 中 开展 ,因而 在 此 基础 上 所 建立 的 方法 论 和 一 些 研究 成 果 还 有 待 于 进 
一 步 在 非 印 欧 语系 中 确认 。 随 着 各 类 翻译 语料库 (包括 翻译 语料库 .类 比 语料库 、 
平行 语料库 ) 在 各 语种 中 的 建立 ,相关 研究 的 结果 在 许多 方面 (如 Puurtinen 1998, 
2003a, 2003b; Mauranen 2000; Tirkkonen-Condit 2000, 2002, 2004; 柯 飞 2003， 
2005 等 ) 对 原 有 基于 印 欧 语系 的 研究 发 现 提出 了 质疑 ,这 就 要 求 我 们 重新 认识 和 
界定 研究 对 象 ,在 原 有 方法 论 的 基础 上 对 研究 方法 加 以 修订 和 完善 。 

具体 可 以 从 以 下 几 个 方面 人 手 :第 一 ,重新 界定 研究 对 象 。 就 翻译 共性 研究 的 
内 容 而 言 ,不 应 仅 局 限于 翻译 过 程 或 语 内 类 比 的 共性 ,而 应 将 源 语 型 和 目标 语 型 两 
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类 共性 包括 进来 加 以 梳理 ,首先 有 针对 性 地 进行 局 部 描写 .分 析 和 解释 ,然后 再 上 
升 到 整体 归纳 。 以 汉 英 /英汉 翻译 中 的 显 化 为 例 可 做 出 这 样 的 分 类 ( 见 表 6. 1)。 


表 6.1 显 化 的 分 类 
显 化 类 型 
形式 上 CT, 相对 于 To) a 
HAMLET Te) ANE 
ELET: 相对 于 Ta) aE “一 
形式 上 (E, 相 对 于 Ca /Ce 相对 于 EE,) sae 
语 际 对 比 (Cue*Es/EsesCu) au 
意义 上 (Es 相对 于 Ca/Cu 相 对 于 ) atir 


(Ti = EDGR To = UE Cu = DA En = RHE; En =E Ca = DO 
(强制 性 显 化 一 语言 系统 差异 导致 的 显 化 ; 非 强制 性 一 翻译 过 程 导致 的 显 化 ) 

首先 依据 不 同 的 语料库 类 型 将 显 化 分 为 语 内 对 比 和 语 际 对 比 显 化 两 类 ,前 者 
是 基于 目标 语 中 翻译 文本 与 原创 文本 的 对 比 研究 ,后 者 则 是 原 语 与 译 语文 本 比较 
分 析 的 结果 ;任何 语言 类 型 通常 都 包括 形式 和 意义 两 部 分 ,在 此 基础 上 各 类 进一步 
分 为 形式 上 和 意义 上 的 显 化 ?两 类 ;然后 再 依据 语言 系统 差异 和 翻译 过 程 两 个 诱 
因 对 强制 性 与 非 强制 性 显 化 @ 进 行 区 分 。 

第 二 ,在 指导 原则 上 ,以 平行 语料库 为 基础 ,在 翻译 研究 中 重新 引入 源 语文 本 。 
翻译 活动 离 不 开源 语文 本 ,即便 是 在 以 目标 语 为 取向 的 描写 翻译 研究 和 基于 语 料 
库 的 翻译 研究 范式 下 对 翻译 共性 的 探讨 也 同样 如 此 ,翻译 文本 的 独立 性 并 不 排斥 
其 与 原 语文 本 之 间 的 联系 。 

第 三 ,在 方法 论 方面 ,以 类 比 语料库 的 研究 成 果 为 出 发 点 ,在 平行 语料库 中 重 
新 进行 验证 分析 和 归纳 。 基 于 语料库 的 研究 的 一 大 特点 就 是 研究 过 程 的 可 重复 
性 (replicability), 这 也 应 当 是 翻译 普遍 特征 研究 的 一 大 特征 。Kenny(2005:155) 
认为 平行 语料库 可 以 接 过 类 比 语料库 的 研究 发 现 ,继而 尝试 在 源 语文 本 中 寻求 对 
这 些 发 现 的 解释 。 


@ 根据 王 克 非 的 观点 ,形式 上 的 显 化 是 狭义 上 的 显 化 , 指 “ 语 言 衔接 形式 上 的 变化 ”意义 
显 化 是 指 “ 在 译文 中 添加 了 有 助 于 译文 读者 理解 的 显 化 表达 ,或 者 说 将 原文 隐 含 的 信息 显 化 于 
译文 中 ,使 意思 更 明确 , 远 辑 更 清楚 ”( 柯 飞 2005) 。 

© ”这 里 借用 Klaudy 的 说 法 ,强制 性 简化 是 指 由 两 种 语言 系统 差异 所 造成 的 显 化 ; 非 强制 
性 简化 是 指 由 翻译 过 程 本 身 、 译 者 偏好 、 目 标语 语文 规范 等 因素 造成 的 显 化 (Baker 2004; 82- 
83)。 
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第 四 ,对 各 种 变量 加 以 关注 和 控制 。 翻 译 共性 研究 结果 不 尽 统一 的 一 个 原因 
就 是 各 种 变量 的 存在 。 其 中 ,语料库 设计 中 的 可 比 性 缺乏 问题 .研究 中 的 参数 选择 
与 文体 类 型 选择 、 翻 译 方向 \ 译 者 因素 等 会 对 研究 结果 产生 很 大 影响 。 

第 五 , 从 语言 \ 认 知 、 社 会 文化 等 视角 对 各 类 翻译 普遍 现象 进行 解释 。 
Chesterman(2004b:10-11) 指 出 共性 若 的 确 存在 ,就 应 当 有 其 存在 的 原因 和 影响 ， 
因此 在 对 翻译 共性 进行 充分 描写 的 基础 上 ,不 仅 从 翻译 活动 内 部 ,如 语言 ,更 应 从 
外 部 ,如 认 知 和 社会 文化 等 视角 对 其 做 出 合理 的 解释 。 柯 飞 (2005) 在 考察 汉 英 / 英 
汉 翻译 中 的 隐 和 显 时 指出 :翻译 中 的 隐 和 显 可 由 语言 . 译 者 .社会 文化 ,文本 类 型 等 
多 种 因素 造成 。 若 将 这 些 方面 综合 起 来 进行 考虑 就 可 以 尝试 建立 一 套 对 翻译 普遍 
现象 的 解释 机 制 ,加 深 对 于 翻译 本 质 的 认识 。 

第 六 ,对 翻译 共性 研究 成 果 的 应 用 。 既 然 翻 译 语言 有 其 特殊 的 存在 形式 ,我 们 
在 实践 中 应 当 遵循 还 是 抵制 此 类 特征 呢 ? 从 逻辑 上 讲 , 翻 译 语言 的 普遍 特征 是 翻 
译文 本 有 别 于 原创 文本 的 主要 所 在 ,如 果 将 原创 文本 作为 常态 的 语言 的 标志 ,那么 
翻译 文本 中 语言 便 是 对 常态 偏离 ,因而 常 被 冠 以 “翻译 腔 "“ 杂 合 语言 "“ 第 三 类 语 
码 ” 等 名 。 实 际 上 ,各 种 语言 变 体 之 间 没 有 训 优 熟 劣 之 分 ,所 谓 的 褒贬 都 是 在 一 定 
社会 文化 条 件 下 的 人 为 因素 造成 的 。 翻 译 语言 作为 一 种 客观 存在 的 “中 介 语 ”, 其 
特征 不 应 被 忽略 ,也 不 应 被 夸大 。 一 定时 期 内 翻译 语言 普遍 特征 的 累积 是 这 一 时 
期 翻译 概念 和 翻译 规范 建立 的 基础 , 认 清 此 类 特征 有 助 于 我 们 在 翻译 研究 中 更 好 
地 认识 特定 时 期 的 翻译 规范 。 

Halverson(2003) 认 为 翻译 共性 研究 所 涉及 的 各 种 词汇 和 语义 模式 都 可 参照 
人 类 认 知 的 一 般 特 征 加 以 解释 。 她 借鉴 Croft(1990) 对 语言 共性 研究 的 归纳 方法 ， 
将 基于 语料库 的 翻译 共性 研究 也 划分 为 三 个 层次 :1) 描 写 层面 ,以 平行 语料库 为 基 
础 ,首先 对 具体 语言 对 中 与 翻译 相 联系 的 各 种 关系 和 结构 加 以 描写 ;2) (内 部 ) 归 纳 
(internal generalization) 层 面 ,对 各 类 现象 从 语言 内 部 及 跨 语言 的 角度 进行 归纳 ， 
单 语 类 比 语料库 的 研究 即 属于 这 一 层次 ; 3) 解释 层面 , 即 外 部 归纳 Cexternal 
generalization) ,从 人 类 认 知 心理 学 、 社 会 学 和 文化 的 角度 对 各 类 翻译 共性 做 出 更 
高 层次 的 解释 。Halverson (2003) 认 为 ,目前 的 翻译 共性 研究 尚 处 于 第 二 个 层 
面 上 。 


英 译 汉语 言 特征 宏观 描述 


本 章 基于 汉 英 双向 对 应 语料库 在 宏观 层面 描写 和 分 析 英 译 汉语 言 的 总 体 特 
征 。 语 料 库 考 察 表明 :与 汉语 原创 文本 比 , 英 译 汉文 本 语言 的 存在 类 符 / 型 符 比较 
高 , 句 段 偏 长 ;汉语 翻译 语言 扩大 了 汉语 某 些 结构 式 的 容量 等 特征 。 这 些 特 征 呈 现 
出 英 译 汉文 本 独 有 的 特征 ,显示 英语 源 语 对 汉语 译文 的 影响 ,同时 也 在 一 定 程度 上 
对 翻译 共性 的 假说 提出 了 挑战 。 


随 着 计算 机 语料库 技术 的 发 展 ,语料库 语言 学 已 经 从 方法 论 和 语言 研究 手段 
成 长 为 一 门 完 整 的 学 科 , 有 纯 理论 研究 也 有 应 用 研究 (Laviosa 2002) 。 基 于 语料库 
的 翻译 研究 ,可 称 为 语料库 翻译 学 ,其 主要 含义 就 是 ,以 语言 理论 和 翻译 理论 为 研 
究 上 的 指导 ,以 概率 和 统计 为 手段 ,以 大 规模 双语 真实 语 料 为 对 象 ,采用 语 内 对 比 
与 语 际 对 比 相 结合 的 方法 ,对 翻译 现象 进行 历时 或 共 时 的 描写 和 解释 ,探索 翻译 的 
本 质 ( 王 克 非 、 黄 立波 2007)。 总 之 ,基于 语料库 的 翻译 研究 已 成 为 一 个 独特 的 研 
究 领 域 ,可 以 从 更 多 的 角度 透视 翻译 ,包括 翻译 语言 。 

从 一 种 语言 翻译 到 另 一 种 语言 多 少 会 存留 一 些 源 语 的 痕迹 ,有 人 称 之 为 
“translationese”, 即 受 源 语 影响 的 不 太 地 道 的 目的 语 运用 方式 (Hopkinson,2007) 。 
“Translationese" 若 译 为 “翻译 腔 ” 则 带 有 些 贬 义 , 译 为 “翻译 体 ” 稍 好 ,也 可 以 使 用 
“translational language” 这 个 相对 中 性 的 术语 。 翻 译 语言 虽然 不 够 “地 道 ”, 但 它 通 
常 不 是 语法 错误 (mistake) ,多 属 语 用 上 的 “ 偏 误 ” 或 差 误 (error) , 源 语 是 这 些 “ 偏 
误 ” 的 源头 (Toury 1995:208)。 用 翻译 语 料 来 研究 翻译 语言 (Gellerstam 1986 : 88- 
95) 已 经 走 过 20 多 个 年 头 。 

根据 Santos(1995:60) ,翻译 语言 研究 包括 三 个 方面 :一 是 所 有 翻译 产品 的 属 
性 , 即 翻译 共性 (universals of translation, Baker 1993) ;二 是 特定 语言 间 翻 译 产 品 
的 属性 , 即 翻译 语言 (translationese) 的 属性 ;三 是 某 个 或 某 类 翻译 产品 反映 出 来 的 
语言 特征 。 本 章 主 要 考察 英语 翻译 成 汉语 后 汉 译 语言 的 特征 ,这 方面 的 研究 对 于 
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英汉 语言 对 比 也 有 重要 意义 。 
7.2 基于 语料库 的 翻译 语言 特征 研究 


翻译 语言 现象 时 有 人 注意 。Gellerstam(1986) 对 比 瑞典 语 翻译 和 非 翻 译 小 说 
文本 ,从 语 内 类 比 角度 讨论 过 “翻译 体 ”(translationese) 的 语言 特征 。 近 年 在 各 种 
语料库 的 基础 上 ,开展 了 一 系列 新 型 翻译 研究 。 国 际 上 ,英国 曼彻斯特 大 学 科技 学 
院 的 Mona Baker 较 早 开展 基于 语料库 的 研究 。 她 在 “语料库 语言 学 和 翻译 研究 ， 
启示 与 应 用 ”(1993) 一 文中 对 这 两 者 的 结合 作 了 初步 阐发 。 在 大 范围 翻译 调查 方 
面 ,如 翻译 文体 的 考察 ,她 (2000) 也 率先 从 语料库 角度 探讨 译 者 的 文体 特征 ,特别 
是 从 类 符 - 形 符 比 , 平 均 名 长 及 词 项 使 用 特点 等 方面 加 以 分 析 。 根 据 Baker(1993， 
1998a) ,翻译 语言 可 能 存在 下 列 共性 :简化 (词汇 上 的 简化 ,即使 用 较 少 的 词 来 进行 
翻译 ,尽量 少 用 生僻 的 字眼 ,使 用 释义 方式 应 对 文化 差异 ;句法 上 的 简化 , 即 复杂 结 
构 被 简化 ;文体 简化 , 即 译文 倾向 于 断 开 长 句 ,减少 或 省 略 重复 的 宛 余 信息 ,减少 词 
汇 重复 等 )、 显 化 (原文 隐 含 的 内 容 在 译文 中 被 明示 出 来 ,衔接 手段 显 化 )、 规 范 化 
(译文 尽量 向 目的 语 的 某 些 典 型 样 态 靠 拢 ,缺少 目的 语 使 用 的 多 样 性 ) 。 

Baker(1998b:225) 认 为 ,翻译 时 与 源 语 文本 特征 相关 的 现象 倾向 于 移植 到 月 
标语 文本 里 。 但 有 批评 者 指出 , Baker 的 研究 主要 基于 类 比 语 料 (comparable 
corpus) ,未 关注 源 语 对 译 语 的 影响 (Hansen & Teich 2001; 吴 昂 、 黄 立波 2006; 黄 
立波 , 王 克 非 2006), 

基于 对 应 语料库 的 汉语 翻译 语言 研究 在 国内 也 已 取得 不 少 进展 , 如 柯 飞 
(2003) 5 SHEAR , EEIE (2004) 5 TK (2005) 5 EJE, AH BME (2008), RAE, EH 
非 \ 胡 显 耀 (2008) 依 据 双语 对 应 语料库 仔细 探讨 了 翻译 汉语 的 特征 ,指出 :无 论 是 
文学 还 是 非 文学 语 料 ,翻译 汉语 与 原创 汉语 相 比 ,具有 词语 变化 度 偏 低 、. 词 汇 密度 
偏 低 , 虚 词 显 化 、 指 代 方式 显 化 、 常 用 词 频率 增加 等 特征 。 国 内 外 这 些 基于 语料库 
的 研究 都 不 同 于 传统 的 “对 等 ”理念 指导 下 的 翻译 研究 ,而 关注 起 翻译 转换 中 语言 
之 间 的 相互 作用 带 来 的 语言 变化 以 及 促成 此 类 变化 的 语言 内 、 外 因素 ,开辟 了 新 的 
翻译 研究 途径 。 但 圈 于 检索 技术 和 研究 手段 的 局 限 ,系统 的 描述 和 分 析 还 不 够 。 
本 章 尝 试 运用 现 有 的 语 料 检索 和 分 析 技术 ,从 宏观 的 层面 (主要 是 类 符 / 型 符 比 、 句 
长 分 布 . 结 构 容量 等 探讨 英 译 汉 的 一 些 语言 特征 ,微观 语言 描写 (词语 分 布 .词语 
组 合 等 ) 部 分 见 第 8 章 。 

考察 汉语 翻译 语言 ,实际 上 就 是 考察 它 在 多 大 程度 上 偏离 汉语 “常态 ”。“ 常 
态 ”余光中 2002:151) 只 是 一 种 语言 直觉 ,并 无 具体 标准 ,但 我 们 可 以 假定 它 存 
在 。 比 如 可 以 把 一 定 规模 的 原创 文本 视 为 汉语 “常态 ”, 因 为 它 比 翻译 文本 更 接近 
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目的 语 的 基本 特征 。 

本 研究 的 素材 取 自 北京 外 国语 大 学 研制 的 汉 英 对 应 语料库 (CEPC)@, 我 们 从 
中 抽取 约 350 万 字 / 词 的 双语 对 应 语 料 。 该 库 为 汉 英 双向 翻译 对 应 语料库 ,各 子 库 
里 的 汉语 文本 可 以 提取 出 来 ,形成 汉语 原创 文本 和 汉语 翻译 文本 类 比 库 。 既 然 番 
译 是 由 源 语 语 篇 诱导 的 篇 章 产生 过 程 ,在 进行 具体 语言 分 析 时 ,我 们 既 考 察 汉语 原 
创 文本 和 汉语 翻译 文本 之 间 的 关系 ,又 考察 汉语 翻译 文本 和 英语 源 语文 本 之 间 的 
关系 。 同 时 ,我 们 也 注意 文学 文本 与 非 文学 文本 的 语言 使 用 有 多少 差异 。 


7.3 对 英 译 汉 语言 特征 的 宏观 描述 


宏观 描述 主要 涉及 汉语 原创 文本 和 翻译 文本 在 类 符 /型 符 比 、 词 长 和 平均 句 长 
上 的 表现 。 类 符 /型 符 比 是 类 符 (types) 和 型 符 (tokens) 之 间 的 比率 。 词 型 和 实例 
依据 ICTCLAS 进行 切 分 ,也 是 句 长 的 计算 单位 。 表 7. 1 是 使 用 WordSmith 4. 0 
得 到 的 统计 结果 : 
表 7.1 原创 文本 和 翻译 文本 的 宏观 描述 
统计 型 符 数 | 类 符 数 | STTR WK | 平均 句 长 | 平均 句 段 长 


汉语 原创 文学 466 414 23047 46.72 1.36 25. 46 6.02 
汉语 原创 非 文学 222758 11066 41.92 | 1.76 由 27.05 | 7.20 
汉语 原创 文本 689172 | 28437 ji 45.19 1.49 25.95 6.35 
汉语 翻译 文学 | 578148 24213 47. 36 1.44 25.81 | 7.00 
汉语 翻译 非 文学 | 496218 | 26174 47. 65 1. 64 31.52 8. 58 
汉语 翻译 文本 1074366 | 36354 | 47.49 1.53 28. 27 7.65 
英语 原创 文学 546632 | 22409 43. 21 azs | 16.76 6.79 
英语 原创 非 文学 | 487673 25739 | 44.37 | 4.87 20. 24 9. 32 
英语 原创 文本 1034305 35695 43.75 4.54 18. 23 7.78 


RT. 1 反映 的 英 译 汉 语言 基本 特征 可 分 析 如 下 : 
7.3.1 类 符 /型 符 比 
一 般 说 来 , 语 库 规模 越 大 ,类 符 (type) 型 符 (token) 比 越 小 。 若 语料库 规模 相 


© CEPC(Chinese-English Parallel Corpus) 是 一 个 汉 英 双向 平行 对 应 语料库 ,于 2002~ 
2003 年 由 王 克 非 教授 主持 创建 , 语 料 以 XML 文件 格式 存储 , 收 中 英文 近 3 000 万 字 / 词 。 
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同 , 类 符 / 型 符 比 越 大 ,就 说 明 用 词 越 丰富 。 由 于 原创 库 和 翻译 库 库 容 差 异 较 大 (如 
汉语 原创 文本 库 在 实例 数量 上 小 于 汉语 翻译 文本 , 约 为 1:1. 6) ,简单 的 类 符 / 型 符 
比 计算 没有 说 服 力 。 因 此 ,本 章 在 进行 类 符 / 型 符 比 (type/token ratio) 计 算 时 ,使 
用 了 WordSmith 4. 0 提供 的 以 1 000 词 为 计算 单位 的 类 符 / 型 符 比 计算 方式 ,得 到 
“标准 化 类 符 / 型 符 比 ”( 见 表 7. 1)。 

表 7.1 显示 ,在 类 符 / 型 符 比 上 ,汉语 原创 文本 比 汉语 翻译 文本 在 类 符 / 型 符 比 
EIRT 2. 3 个 百分点 (45. 19 vs. 47. 49) ,但 都 高 于 英语 原创 文本 (43. 75)。 汉 语 翻 
译 语言 在 用 词 丰 富 程度 上 低 于 英语 源 语 ,但 又 高 于 汉语 原创 语言 。 这 一 差异 说 明 ， 
汉语 翻译 文本 在 用 词 丰富 程度 上 高 于 汉语 原创 文本 和 英语 源 语文 本 。 该 项 统计 结 
果 不 支持 翻译 语言 较 原创 文本 用 词 简单 这 一 假设 。 


7.3.2 平均 词 长 


总 体 说 来 ,汉语 原创 文本 和 翻译 文本 都 以 双 音 节 和 单 音节 词 占 主导 地 位 ,汉语 
翻译 语言 基本 符合 汉语 本 身 的 词汇 运用 特征 。 汉 语 原创 文本 使 用 单 音 节 词 稍 多 ， 
但 总 体 看 来 ,两 者 没有 明显 的 区 别 。 


7.3.3 平均 句 长 


统计 显示 ,汉语 翻译 文本 的 平均 句 长 高 于 汉语 原创 文本 (每 句 平均 高 出 2. 32 
个 词 )。 这 一 差异 在 非 文学 文本 里 差异 尤为 明显 (高 出 4. 47 词 ), 差 异 不 大 的 是 文 
学 文本 ( 差 值 :0. 35)。 那 么 ,这 些 差异 和 英语 语源 语文 本 有 什么 关系 ? 仅 从 句 长 上 
说 ,汉语 翻译 文本 句子 偏 长 和 英语 源 语 似乎 没有 多 大 关系 ,因为 后 者 的 句 长 (18. 23) 
远 远 小 于 前 者 。 但 实际 翻译 的 语言 材料 显示 ,汉语 翻译 时 的 句子 扩张 与 英语 源 语 
有 关 。 


(1) And Pinkerton—Pinkerton—he has collected ten cents that he 
thought he was going to lose. 

那么 /c 平 克 顿 /nr 一 /x 平 克 顿 /nr 一 /x 他 /r 一 定 /d 是 /u 要 /v 回来 /dg 
一 /m 角 /q 钱 /n 的 /u 老 /a 账 /n,/w 这 笔 /r 钱 /n 他 /r 本 来 /d 以 为 /v 没有 /v 
盼 头 /n 了 /y。/w(16:22) 

(2) You speak collectedly, and you—are collected, 

你 /r 这 /r 话 /n 倒 /y 还 有 /v 自制 力 /n,/w 而 /c 你 /r 一 /x 也 /y 确实 /d 镇 
静 /a。/w(7:10) 


汉语 的 孤立 语 性 质 意味 着 要 使 用 词汇 手段 表达 一 些 英语 使 用 语法 或 其 他 组 合 
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手段 表达 的 内 容 。 如 例 (1) 中 的 关系 词 that 译 为 名 词 短 语 “ 这 笔 钱 ”, 过 去 式 
(thought) 在 翻译 时 通过 词汇 手段 (本 来 ) 添 加 时 间 标 记 ( 译 为 “本 来 以 为 ”)。 还 有 ， 
英语 介词 (如 onin) 表 达 的 意念 在 汉语 中 常用 “介词 十 …… 十 方位 词 ”来 表达 。 上 
述 各 种 添加 多 少 带 有 一 些 强制 性 ,更 常见 的 添加 则 是 选择 性 的 。 比 如 ,翻译 时 可 能 
会 发 生词 性 改变 (如 例 (2) 中 的 “这 、 话 ”“ 自 制 力 ”) ,相应 的 成 分 都 须 作出 调整 , 句 
子 调整 的 幅度 随 之 加 大 ,原文 中 隐 含 的 表情 态 成 分 也 可 能 随 之 明示 出 来 (如 “ 倒 、 
也 、 确 实 ")。 不 论 是 哪 类 添加 ,都 会 致使 汉语 翻译 语言 的 平均 句 长 高 于 英语 原创 文 
本 语言 。 这 可 以 部 分 证 实 显 化 现象 。 

但 这 只 反映 出 汉语 翻译 语言 的 句子 长 度 ,而 仅 计算 以 句号 ,问号 和 叹 号 为 切 分 
点 的 句子 长 度 还 无 法 反映 句子 内 部 组 织 特征 。 根 据 Chen(1994),75% 的 汉语 句子 
由 两 个 以 上 的 句 段 构成 。 句 段 可 以 是 一 个 小 句 , 也 可 以 是 一 个 短语 ,但 它 一 定 是 句 
中 由 逗号 或 分 号 隔 开 的 相对 独立 的 构 句 成 分 。 句 段 统计 显示 ,汉语 文本 的 句 段 长 
度 低 于 英语 文本 ;更 重要 的 是 ,汉语 翻译 文本 的 句 段 长 度 明 显 高 于 汉语 原创 文本 ， 
且 更 接近 英语 源 语文 本 。 

仅 从 统计 数据 上 看 ,汉语 翻译 语言 用 词 比较 丰富 ,句子 偏 长 ,没有 期 待 中 那么 
通俗 易 懂 , 也 没有 表现 出 翻译 共性 所 言 的 句法 简化 特征 。 而 且 , 汉 语 翻译 文本 中 的 
句 段 长 度 大 于 汉语 原创 文本 ,这 显然 是 英语 源 语 干预 的 结果 。 


7.4 结构 容量 


根据 表 7. 1, 汉 语 翻译 语言 使 用 的 句子 偏 长 ,原因 很 多 。 从 语法 上 说 ,由 于 汉 
语 是 不 同 于 印 欧 语言 的 非 形 态 语言 ,英语 里 的 一 些 语法 手段 (如 英语 里 的 体 和 时 
态 ) 在 汉 译 时 通常 需要 运用 词汇 手段 来 表达 ,这 自然 会 增 大 句 长 ;从 组 织 方式 上 看 ， 
英语 常 使 用 较 长 的 分 句 , 在 汉 译 时 若 保留 分 句 形式 也 会 增加 句 长 ;从 翻译 策略 上 
看 ,汉语 译文 可 能 会 为 了 方便 目的 语 读者 理解 而 加 上 一 些 解释 性 话语 。 

但 语 料 分 析 显 示 , 上 述 差异 并 不 足以 说 明 汉语 的 翻译 和 原创 文本 在 句 长 上 存 
在 明显 差异 ,翻译 语言 扩展 了 汉语 某 些 结构 式 的 容量 才 是 主因 。 容 量 扩展 表现 在 
以 下 两 个 方面 : 

谓语 和 宾语 之 间 的 距离 拉 大 了 , 即 英汉 翻译 时 常 把 原本 后 置 且 开 放 的 英语 定 
语 (从 名) 前 置 于 宾语 之 前 (主要 是 “的 …… 的 NP” 结 构 式 ) ,这 大 幅 提 高 了 汉语 谓 宾 
之 间 的 结构 张力 ; 

汉语 的 一 些 介词 短语 (介词 -NP- 方 位/ 时间) 本 身 是 封闭 结构 ,容量 有 限 ,但 番 
译 语言 通常 需要 将 较 长 的 多 重修 饰 成 分 塞 人 这 种 结构 ,致使 其 容量 扩张 。 

我 们 以 “在 …… 中 ”为 例 说 明 这 一 点 ( 见 表 7. 2) 。 


第 2 部 分 语料库 与 翻译 研究 / 61 


表 7.2 “在 …… 中 "的 结构 容量 


原创 非 文学 原创 文学 翻译 非 文学 
相对 相对 相对 
频次 频率 % 频次 频次 


4 个 词 以 内 | 260 67.88 | 183 91.5 
5 个 词 以 上 123 32.12 17 8.5 360 27.67 


合 it 383 100 200 100 1301 100 598 100 
———___1_i1—__ 


如 表 7. 2 所 示 ,“ 在 …… 中 ”结构 的 容量 与 文本 类 型 相关 。 在 汉语 原创 文学 文 
本 中 ,有 91. 5% 的 “在 …… 中 ”结构 的 容量 在 4 个 词 以 内 , 单 音节 词 更 是 占 到 了 
47%; 而 在 翻译 文学 文本 里 ,结构 容量 在 4 词 以 内 的 只 占 74.91%。 可 以 看 出 ,原创 
文学 文本 里 “在 …… 中 ”结构 的 容量 要 远 远 小 于 原创 非 文 学 文本 。 有 趣 的 是 ,这 一 
区 别 在 两 类 翻译 文本 中 表现 得 不 是 那么 明显 ,原因 可 能 是 汉语 文学 翻译 不 太 注意 
该 类 结构 式 在 语 域 上 的 差异 。 

与 “在 …… 中 ”结构 相似 的 还 有 “在 …… 时 ”和 “介词 十 NP 十 处 所 词 "结构 。 这 
些 封闭 的 结构 式 容量 有 限 , 但 在 翻译 语言 里 ,它们 的 容量 均 有 大 幅 扩 张 。 

上 述 扩容 现象 受 源 语 影响 ,但 不 是 源 语 单独 作用 的 结果 。 还 有 -~- 个 原因 :翻译 
语言 过 分 利用 了 汉语 本 身 的 结构 张力 。 尽 管 英语 谓 - 宾 之 间 容 量 有 限 , 但 修饰 成 分 
后 置 (如 使 用 定语 从 句 ,介词 短 语 ) 可 以 避 开 这 种 容量 限制 。 汉 语 则 不 然 , 它 的 修饰 
成 分 通常 前 置 。 所 以 , 若 不 使 用 其 他 方式 ,汉语 只 能 靠 扩 展 结构 容量 来 解决 修饰 问 
题 。 扩 容 意味 着 不 能 快速 处 理 主干 成 分 ,这 会 加 重工 作 记 亿 负担 。 因 此 ,结构 容重 
扩张 后 ,汉语 翻译 文本 语言 不 如 汉语 原创 文本 语言 易 读 、 易 解 。 


7.5 小 结 


汉 英 对 应 语料库 的 考察 和 分 析 表 明 , 同 汉语 原创 文本 比 , 英 译 汉文 本 语言 的 标 
准 化 类 符 / 型 符 比较 高 、 句 段 偏 长 ,表明 汉语 翻译 文本 在 用 词 丰富 程度 上 高 于 汉语 
原创 文本 和 英语 源 语文 本 。 另 外 ,汉语 翻译 语言 扩大 了 汉语 某 些 结构 式 的 容量 , 导 
致 汉语 翻译 文本 语言 不 如 汉语 原创 文本 语言 易 读 、 易 解 。 这 些 特征 呈现 出 英 译 汉 
文本 语言 独 有 的 特征 ,显示 英语 源 语 对 汉语 译文 的 影响 。 从 这 个 意义 上 说 ,特定 语 
言 间 的 语言 转换 现象 ,或 翻译 语言 的 局 部 特征 ,不 一 定 是 所 有 翻译 语言 共有 的 属 
性 ,翻译 共性 的 探讨 还 有 待 深入 。 


第 8 章 


英 译 汉 语言 特征 微观 描述 


本 章 基于 汉 英 双向 对 应 语料库 从 微观 角度 描写 和 分 析 英 译 汉语 言 的 词汇 特征 。 
研究 发 现 :与 汉语 原创 文本 相 比 ,汉语 翻译 文本 在 词类 分 布 和 某 些 词 ( 素 ) 的 组 合 能 力 
上 有 差异 ;在 词类 分 布 方面 ,汉语 翻译 文本 较 汉语 原创 文本 更 多 地 使 用 虚词 , 较 少 使 
用 实 词 ,汉语 翻译 文本 比 汉语 原创 文本 较 少 使 用 单 音节 词 . 较 多 使 用 双 /多 音节 词 , 其 
介词 .连词 和 代词 的 使 用 频率 也 高 于 汉语 原创 文本 ;在 词汇 组 合 方面 , 英 译 汉文 本 可 
能 使 用 汉语 原创 文本 不 太 常 用 的 词 或 多 词组 合 形式 。 这 些 特征 大 多 为 英 译 汉语 言 
独 有 的 特征 ,不 能 完全 用 翻译 共性 来 解释 ,而 应 充分 考虑 英文 源 语 对 译文 的 影响 。 


8.1 引言 


本 章 研 究 的 是 特定 语言 间 翻 译 产 品 的 特性 , 即 翻译 语言 (translationese) 的 特征 ， 
即 Santos(1995:60) 关 于 翻译 语言 研究 讨论 的 第 二 个 方面 ,具体 就 是 英 译 汉 语言 的 特 
征 ,这 类 研究 对 汉 英 语言 对 比 有 重要 意义 。 前 一 章 在 比较 宏观 的 层面 上 探讨 了 英 译 汉 
语言 特征 ,本 章 侧重 翻译 语言 的 微观 层面 , 即 尝试 运用 现 有 的 语 料 检索 和 分 析 技 术 在 词 
类 分 布 和 词语 组 合 等 能 够 体现 语言 个 性 的 层面 上 描写 和 分 析 英 译 汉 语言 的 基本 特征 。 

本 研究 使 用 的 素材 和 例句 取 自 北京 外 国语 大 学 的 通用 汉 英 对 应 语料库 
《CEPC) 。 该 库 为 汉 英 双向 翻译 对 应 语料库 ,各 子 库 里 的 汉语 文本 可 以 提取 出 来 ， 
形成 汉语 原创 文本 和 汉语 翻译 文本 类 比 库 。 由 于 翻译 是 源 语 语 篇 诱导 的 篇 章 产生 
过 程 ,因此 ,在 进行 语言 分 析 时 , 婚 对 比 汉语 原创 和 汉语 翻译 文本 ,又 考察 汉语 翻译 
文本 和 英文 源 语文 本 之 间 的 关系 。 


8.2 英 译 汉 语言 的 词类 分 布 


8.2.1 统计 数据 
词类 分 布 能 部 分 反映 语言 的 类 型 和 特点 。 表 8. 1 是 各 主要 词类 在 CEPC 中 英 
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文 原创 和 翻译 文学 子 库 中 的 分 布 情况 。 汉 语 分 词 和 词类 标注 使 用 ICTCLAS( 北 大 
标准 ) ,英文 词类 标注 使 用 CLAWS。 


表 8.1 英 译 汉 词类 分 布 频率 
一 一 一 


分 布 汉语 原创 文学 汉语 翻译 文学 英文 原创 文学 

词类 词 数 频率 词 数 频率 词 数 频率 
动词 110391 | 23.64 | 133762 | 22.93 | 108340 | 19.88 
名 词 100827 | 21.59 | 113823 | 19.52 | 112536 20, 65 
形容 词 24 948 5. 34 24672 | 4,23 35 846 6. 58 
副词 48676 L 10, 42 52266 8. 96 42065 7.72 
代词 41 259 8. 83 68859 | 11.81 64433 | 11.82 
介词 | 14536 3.11 | 25932 4.45 Æi 58 A 10. 78 
连词 9687 2.07 | 15252 2.61 39304 7.21 
数 词 17322 3.71 20174 3.45 8463 1.5 
量词 14209 3.04 16337 2. 80 0 
助词 39370 8.51 57372 9. 84 0 0 
冠 词 (英文 ) oj 。 0 0 52325 9. 60 
限定 成 分 (英文 0 0 0 0 17132 3.14 
总 词 数 及 所 占 比 率 | 467007 i 90.26 | 583260 | 90.6 545000 | 98. 88 
备注 其 他 词类 未 作 统计 “| ”其 他 词类 未 作 统 计 | ”其 他 词类 未 作 统计 


根据 表 8. 1 制作 的 词类 分 布 折 线 图 见 图 8. 1。 


123 4 56 7 8 9101112 
词性 


图 8.1 词类 分 布 折线 图 
注 : 模 轴 上 的 数字 分 别 代表 :1 一 动词 ;2 一 名 词 ;3 一 形容 词 ;4 一 副词 ;5 一 代词 !6 一 介词 ， 
7 一 连词 ;8 一 数 词 !9 一 量词 ;10 一 助词 ;11 一 冠 词 ( 英 文 );12 一 限定 成 分 (英文 ) 


从 图 8. 1 中 可 以 清楚 地 看 出 ,汉语 翻译 文本 和 汉语 原创 文本 的 词类 分 布线 型 
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基本 一 致 ,但 和 英文 原创 文本 差异 较 大 。 可 以 说 ,汉语 翻译 语言 与 汉语 原创 语言 之 
间 的 差异 要 远 远 小 于 它 和 英语 源 文 之 间 的 差异 , 即 汉语 翻译 语言 总 体 上 符合 汉语 
的 语言 特征 。 

从 图 中 还 可 看 到 英文 动词 的 使 用 频率 要 低 于 汉语 近 4 个 百分点 ,这 可 以 证 实 
英文 多 用 名 词 而 汉语 动词 活跃 的 观点 ( 思 果 ,2002:55-58; 邵 志 洪 ,2005:24)。 但 英 
文 代词 .介词 和 连词 的 使 用 频率 则 高 于 汉语 (分 别 高 出 3、7、5 个 百分点 ) 。 受 这 一 
差异 影响 ,汉语 翻译 语言 在 动词 使 用 上 略 低 于 汉语 原创 文本 使 用 的 语言 ,在 代词 和 
介词 使 用 上 则 高 于 后 者 。 但 在 连词 使 用 上 ,汉语 翻译 语言 似乎 没有 受 英文 太 多 的 
影响 。 

汉语 翻译 文本 和 汉语 原创 文本 在 词类 分 布 上 有 以 下 特征 :前 者 动词 ,名词 . 形 
容 间 和 副词 的 使 用 频率 低 于 后 者 ;而 在 代词 .介词 连词 .助词 等 的 使 用 频率 上 明显 
高 于 后 者 。 换 言 之 ,汉语 翻译 文本 使 用 实 义 词 的 频率 较 低 ,使 用 功能 词 的 频率 偏 
高 。 鉴 于 英文 原创 语言 中 功能 词 的 使 用 频率 明显 高 于 汉语 原创 语言 ,有 理由 认为 
这 一 差异 是 翻译 时 受 源 语 即 英文 影响 的 结果 。 

目前 的 分 析 说 明 , 汉 语 翻译 文本 和 汉语 原创 文本 在 某 些 词类 的 使 用 频率 上 有 
差异 ,但 词类 分 布 的 形态 基本 一 致 。 然 而 , 仅 赁 这 些 还 不 足以 充分 反映 两 类 文本 在 
词汇 使 用 上 的 差异 ,我 们 还 需要 考察 词类 内 部 某 些 词 项 使 用 的 情况 。 为 此 ,本 章 使 
用 WordSmith4. 0 中 的 Keywords 工具 对 比 翻 译文 本 和 原创 文本 在 词汇 使 用 上 的 
差异 。 以 下 是 对 比 结果 。 


8.2.2 实 词 的 使 用 


8.2.2.1 名 词 

两 类 文本 在 名 词 使 用 上 的 差异 表现 在 以 下 两 个 方面 。 词 汇 方面 :汉语 原创 文 
本 高 频 使 用 当 差 、 洋 车 .饺子 表姐. 姑 奶奶 .旗袍 , 夜 棍 等 词语 ;而 汉语 翻译 文本 高 
频 使 用 上 帝 、 绅 十 牧师 等 词语 。 名 词素 方面 :汉语 原创 文本 高 频 使 用 兄 . 时 、 寺 、 
堂 氏 \ 帖 裔 , 涉 及 称谓 (如 令 堂 ). 时 间 ( 如 午时 )\ 命 名 (如 白 塔 寺 )。 翻 译文 本 和 非 
翻译 文本 在 普通 名 词 使 用 上 的 差异 大 都 与 社会 ,文化 和 生活 环境 有 关 , 有 时 赁 直 觉 
就 能 判断 出 来 。 

8.2.2.2 动词 

统计 显示 ,汉语 翻译 文本 中 有 几 类 词 的 使 用 明显 高 于 原创 文本 :1) 体 动词 : 开 
始 ,结束 ;2) 发 生 类 动词 :发 生 、 产 生 ;3) 发 现 类 动词 :表现 ,发 现 ;4) 使 让 类 :让 ;5) 判 
断 类 动词 :认为 .相信 感觉 ;6) 情 感 类 动词 :害怕 、 怀 疑 ;7) 其 他 :具有 、 存 在 。 这 些 
词 在 汉语 原创 文本 中 的 出 现 频率 也 很 高 ,但 远 没有 翻译 文本 用 得 频繁 。 原 因 只 有 
一 个 ,与 这 些 词 对 应 的 英文 表达 (动词 ,介词 短语 ,形容 词 ) 在 英文 源 语文 本 里 均 高 
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频 使 用 。 

统计 还 显示 ,在 汉语 原创 文本 里 高 频 使 用 的 单 音节 动词 远 远 多 于 汉语 翻译 文 
本 ,如 单 音节 动词 姿 . 搁 、 走 、 傍 、 喷 、 嫌 ,. 吵 、 捧 、 混 ,全 。 该 现象 可 以 这 样 解 释 : 论 数 
量 ,汉语 里 双 音节 词 比 单 音 词 多 ,但 最 常用 的 词 多 是 单 音节 ( 吕 叔 湘 1999[ 1980]: 
10) ,而 从 外 文 翻译 成 汉语 的 词 通常 都 是 双 音 节 词 。 

8.2.2.3 形容 词 

对 比 表明 ,原创 文本 和 翻译 文本 在 形容 词 使 用 上 的 最 大 差异 是 单 音节 形容 词 
的 使 用 。 例 如 ,原创 文本 中 高 频 使 用 脆 、 高 . 贵 、 好 、 红 、 厚 、 慌 、 紧 、 老 、 俏 、 小 .人 饱 . 蔡 
等 单 音节 形容 词 ,而 翻译 文本 中 高 频 使 用 的 单 音节 形容 词 要 少 得 多 ,只 有 大 、 久 、 
多 、 太 , 快 等 。 很 明显 ,类 似 于 单 音 节 动 词 的 使 用 , 单 音节 形容 词 的 使 用 数量 和 使 用 
频率 也 能 说 明 汉 语 翻 译文 本 使 用 双 音 节 词 的 倾向 更 强 -一 些 。 

8.2.2.4 代词 

在 代词 使 用 上 ,原创 文本 使 用 的 下 列 代词 明显 高 于 翻译 文本 ,如 :大 家 、 她 们 、 
怎 、 人 怎样 .这 自己 等 。 而 翻译 文本 高 频 使 用 的 代词 和 指示 词 有 :她 他、 他们、 它 、 它 
们 ,我 我们 、 那 那儿 .那个 那 时 、 那 种 、 这 个 、 这 时 、 这 种 、 这 样 .其 他 、 另 、 别 的 , 任 
何 、 每 个 ,一切 等 。 不 难看 出 ,相对 于 汉语 原创 文本 ,翻译 文本 高 频 使 用 第 一 和 第 二 人 
称 代词 指示 代词 和 量词 ,这 是 汉语 翻译 语言 的 独特 之 处 ,有 关 的 分 析 见 8. 3. 2 节 。 

8.2.2.5 方位 词 

汉语 原创 文本 高 频 使 用 的 方位 词 不 多 ,只 有 里 、 外 边 、 内 。 而 汉语 翻译 文本 高 
频 使 用 的 方位 词 十 分 丰富 ,如 : 以前、 之前、 之 间 、 之 后 ;之 中 .之 下 ,下 面 .附近 、 上 
面 . 之 外 ,中 ,周围 。 出 现 这 种 差异 的 主要 原因 是 源 语 英文 里 高 频 使 用 介 ( 连 ) 词 ,如 
before after between, in under, near „around 等 ,翻译 文本 受 此 影响 而 使 用 较 多 的 
双 音 节 方 位 词 。 

8.2.2.6 副词 

汉语 翻译 文本 在 副词 使 用 有 以 下 特点 : 

翻译 文本 高 频 使 用 的 时 间 副 词 远 远 多 于 原创 文本 , 主要 是 因为 英文 原文 里 的 
语法 手段 如 完成 体 和 进行 体 在 译 成 汉语 时 需要 以 词汇 手段 ( 正 \ 已 ,已 经 ,一 直 ) 表 
达 出 来 。 

语气 类 副词 表达 说 话 者 对 某 一 命题 的 态度 ,翻译 语言 中 使 用 频率 相对 较 高 的 
副词 有 必须 、 或 许 、 况 然 、 大 约 、 如 此 等 。 原 创 文本 也 高 频 使 用 一 些 表达 情态 的 副 
词 ,如 得 \ 兴 许 、 原 来 , 却 、 来 (如 十 来 天 ) .这 么 等 。 因 此 ,这 种 差异 不 只 是 频率 上 的 ， 
还 体现 在 遗 词 方面 , 即 汉语 翻译 文本 在 副词 使 用 上 变化 较 少 且 有 双 音节 倾向 ,不 如 
原创 文本 那么 丰富 。 
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8.2.3 虚词 的 使 用 


在 虚词 方面 ,汉语 翻译 文本 和 汉语 原创 文本 的 差异 主要 表现 在 连词 的 使 用 上 。 
统计 显示 ,汉语 翻译 文本 高 频 使 用 的 连词 在 总 量 上 多 于 原创 文本 (16:7), 有 句 间 连 
词 (不 过 ,但 ,但 是 ,尽管 .或 者 ,不仅 \ 而 且 . 另 外 ,哪怕 .即使 如果、 然后 .因此 ,于 
是 ) 和 词语 间 连 词 (和 )。 与 之 相 比 ,原创 文本 中 高 频 使 用 的 连词 为 数 不 多 ,只 有 “可 
是 ,并且 \ 况 且 \ 不 但 ,所 以 \ 假 车, 愈 …… 愈 ”。 出 现 这 一 差异 的 原因 是 :汉语 常 隐 含 
逻辑 关系 ,而 英文 则 更 倾向 于 将 逻辑 关系 明示 。 正 是 受到 源 语 英文 的 影响 ,翻译 文 
本 较 原创 文本 更 倾向 于 使 用 连词 来 表达 各 种 逻辑 关系 。 

上 面 的 分 析 显示 ,汉语 翻译 语言 在 词类 分 布 上 深 受 源 语 的 影响 ,表现 在 两 个 方 
面 : 一 ` 汉 语 翻译 文本 较 汉语 原创 文本 使 用 功能 词 偏 多 ,使 用 实 义 词 偏 少 ;二 ,汉语 
翻译 语言 倾向 于 使 用 双 音 节 词 , 单 音节 词 使 用 的 数量 和 频率 都 不 及 汉语 原创 文本 。 


8.3” 匡 译 汉 词 语 的 组 合 方式 


汉语 翻译 语言 可 能 会 过 度 运用 目的 语 某 些 语素 或 词汇 的 组 合 能 力 , 导 致 这 些 
词 ( 素 ) 的 组 合 能 力 变 强 , 表 现在 以 下 三 个 方面 。 


8.3.1 名 语素 的 使 用 


下 面 以 “一 性 ?为 例 对 比 汉语 名 语素 的 组 合 能 力 。 从 分 布 密度 上 看 ,汉语 原创 
文学 文本 中 “一 性 "类 名 词 的 分 布 频率 约 为 2. 9/ 万 词 :而 它 在 翻译 文学 文本 中 的 分 
布 频率 为 5. 2/ 万 词 。 不 仅 如 此 ,一 性 ?在 翻译 文本 中 组 合 方式 多 样 。 例 如 ,翻译 
文本 中 使 用 了 71 个 “一 性 ”组合 词 ,其 中 有 42 个 是 原创 文本 里 低频 使 用 的 :如 独创 
性 ,决定 性 \ 历 史 人 性、 可 信 性 ,坚定 性 、 实 质 性 强制 性 ,煽动 性 ,等 等 。 与 翻译 文本 相 
比 ,原创 文本 中 “一 性 ”组合 词 的 数量 较 少 ( 共 41 个 词 ), 且 多 与 单 音节 词组 合 ,如 爽 
PE EHE KEE HHE JETE BIHE, Ei. 

这 种 组 合 上 的 差异 显然 与 英文 原文 -lity,-ness,-dom,-ity 类 后 级 的 高 频 使 用 
有 关 。 在 处 理 这 类 转 类 词 时 ,汉语 翻译 语言 倾向 于 使 用 “性 ”语素 附加 类 别 标记 ,最 
终 导致 其 组 合 能 力 增强 。 

上 述 情形 适用 于 “一 力 ?"“ 一 度 " 等 组 合 。 这 些 带 有 术语 特征 的 名 语素 在 翻译 文 
本 中 的 出 现 频率 上 高 于 汉语 原创 文本 ,很 大 程度 上 是 对 源 语 组 合 方式 的 模仿 和 借用 。 


8. 3.2 “指示 代词 十 数量 词 "组 合 
检索 显示 ,翻译 文本 高 频 使 用 指示 代词 (这 / 那 ) 和 数量 短语 组 合 。 表 8. 2 显示 
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的 是 差异 最 明显 的 三 个 组 合 

表 8. 2 指示 代 词 十 数量 词组 合 在 两 类 文本 中 的 分 布 
翻译 文本 | 原创 文本 
频 次 ps 频 次 | 转移 几率 


这 一 | 1010 0. 035 
这 种 | 491 0.09 
这 件 事 123 0.017 81 0. 018 


“这 一 ”: 原 创 文本 中 与 “这 一 ”有 统计 意义 的 搭配 词 有 点 (71) 、 条 (19) 、 天 (11) 、 
次 (28) ,年 (10) ;翻译 文本 里 除了 条 、 天 、 次 ,还 有 “问题 条款、 事实 、 目 标 、 领 域 .类 、 
计划 、 过 程 .观点 "。 差 异 很 明显 :在 原创 文本 里 ,“ 这 一 ”与 单 音节 量词 搭配 居多 ;在 
翻译 文本 里 , 它 与 双 音 节 普 通 名 词 共 现 得 更 频繁 。 

“这 种 ”,“ 这 种 ”在 原创 文本 里 的 组 合 能 力 不 强 ,主要 和 “人 ” 共 现 ;即便 如 此 ,为 
数 也 远 远 少 于 翻译 文本 (分 别 为 39 和 295) 。 在 翻译 文本 里 , 它 的 组 合 方式 异常 丰 
富 , 还 频繁 跟 药 \ 病 , 事 、 做 法 想法、 现象 .感觉 ,情况 .方式 .方法 等 名 词组 合 在 一 
起 。 统 计 显示 ,翻译 文本 中 “这 种 、 这 一 ”的 高 频 使 用 与 英文 源 语 the/this/that 的 高 
频 使 用 密切 相关 。 

出 于 同样 的 原因 ,翻译 语言 中 数量 短语 (一 个 ,一 件 , 一 位 ,一 片 等 ) 的 使 用 频率 
远 远 高 于 原创 文本 ,主要 原因 是 :汉语 译文 倾向 于 以 显 性 的 表达 (数量 短语 ) 来 处 理 
冠 词 这 个 英文 中 高 频 使 用 的 语法 范畴 。 

当然 ,有 些 数量 短语 的 使 用 还 与 它 在 语 简 中 所 起 的 衔接 功能 有 关 。 比如 ,“ 这 件 
事 " 在 翻译 文本 和 原创 文本 中 的 转移 几率 相当 。 它 在 翻译 文本 中 的 出 现 频率 虽 高 ,但 
在 英语 源 语 中 与 它 对 应 的 大 都 不 是 the matter ,the thing ,而 是 it.this,that, W: 


(1) a. It had happened at last. 
这 件 事 终于 发 生 了 。 
b. “Nobody knows about this but us?” 
“除了 咱们 , 没 人 知道 这 件 事 吧 ?” 


c. “Humph! We’ll see about that. ” 


© ”转移 几率 (transitional probability) 衡 量 某 一 词 穿 在 给 定 文本 中 一 起 出 现 的 概率 。 例 如 
“这 ”在 给 定语 料 库 中 出 现 100 次 ,其 中 2 次 出 现在 “一 ”之 前 ,而 98 次 出 现在 其 他 词 之 前 ,那么 ， 
转移 几率 p( 一 | 这 ) 一 2/100 一 . 02; 而 转移 几率 p( 其 他 | 这 ) 一 98/100 一 . 98。 转 移 几率 的 计算 方 
式 类 似 于 MI 值 , 值 越 高 在 一 起 出 现 的 几率 就 越 大 。 该 数值 来 自 Antconc 检索 软件 。 
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“ 嗯 ,这 件 事 我 们 得 管 一 管 了 。 
d. There must “a” been an angel there. 
这 件 事 一 定 有 个 高 手 在 帮 你 的 忙 。 


从 语 篇 角度 看 ,上 述 例证 改变 了 衔接 方式 ( 即 名 词 短语 替代 了 源 语 中 的 代词 和 
有 指示 意义 的 副词 )。 改 换 衔接 方式 显然 反映 了 中 英文 在 衔接 手段 上 的 差异 (汉语 
较 英文 更 多 使 用 词汇 手段 ), 但 结果 导致 了 “这 件 事 ” 在 汉语 翻译 语言 中 的 高 频 使 
用 ,所 以 导致 这 一 状况 出 现 的 原因 还 是 源 语 。 从 另 一 个 角度 看 ,转换 衔接 方式 或 添 
加 衔接 成 分 都 是 为 了 让 译文 更 符合 目的 语 规范 。 这 种 显 化 现象 在 翻译 语言 中 有 ， 
但 不 多 ;总 体 看 来 ,汉语 翻译 语言 代词 使 用 的 密度 要 高 于 汉语 原创 语言 ,接近 英文 
源 语 。 

以 上 分 析 说 明 , 源 语 的 一 些 语法 特征 ( 冠 词 .指示 代词 ) 驱 使 译 者 不 自觉 地 模仿 
英文 源 语 的 表述 方式 ,向 源 语 靠 拢 。 其 结果 是 ,汉语 原创 语言 中 的 某 些 组 合 方式 被 
过 度 使 用 。 


8.3.3 ”表达 式 用 法 相对 固化 


汉语 翻译 语言 常常 会 扩展 汉语 中 某 些 表达 式 的 功能 和 用 法 ,或 者 高 频 使 用 某 
些 目的 语 里 的 结构 形式 。 根 据 柯 飞 (2003) 的 研究 ,汉语 翻译 文本 中 使 用 “把 ”字句 
的 频率 要 远 远 高 于 汉语 原创 文本 ,主要 原因 如 下 :1) 英 文 里 高 频 使 用 一 些 表达 客体 
位 置 变化 的 动词 ,如 put, place, push hand 等 ,这 些 动词 的 “处 置 " 义 正好 可 以 使 用 
“把 ”字句 来 表达 ;2) 英 文 里 有 些 常用 动词 ,如 turn, break, smash, clean 等 ,融合 过 
程 与 结果 ,通常 表达 宾语 受到 外 力 影响 发 生 位 置 或 状态 改变 ,也 适合 用 “把 ”字句 来 
表达 ;3) 英 文 里 有 些 表 处 置 义 的 结构 式 如 “have. . . done, get. .. done, let/make. ..” 
也 可 以 译 成 “把 ”字句 。 上 述 语词 在 英文 源 语 中 高 频 应 用 是 汉语 译文 里 高 频 使 用 
“把 ”字句 的 主要 原因 。 

Schiffrin 认为 ,英文 里 的 话语 标记 如 think it seems 等 评述 性 小 句 (comment 
clause) 和 日 常 交际 用 语 (conversational routine) 如 thank you 等 的 词汇 化 程度 较 
高 ,原因 是 它们 的 固化 程度 较 高 ( 转 引 自 Brinton & Traugott 2005:67) 。 在 汉语 翻 
译 语言 里 , 受 源 语 影响 的 某 一 典型 译 法 在 翻译 时 变 成 了 相对 稳定 的 表达 形式 ,用 于 
表达 源 语 中 其 他 有 相近 意义 的 表达 形式 ,这 就 形成 了 表达 式 的 固化 。 限 于 篇 幅 , 本 
章 只 介绍 两 个 。 


“ 随 着 时 间 的 推移 ” 
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该 表达 式 在 翻译 文本 里 可 谓 “ 一 专 多 能 ”。 一 专 是 指 它 专用 于 表达 时 间 流 转 ; 
多 能 是 指 它 能 对 应 源 语 中 多 样 的 时 间 表 达 , 如 as time went on, moment by 
moment, over time, as time drifted along, with a long-term time horizon, in the 
course of time,as time went by, 甚 至 还 有 eventually. 

另外 ,这 个 表达 式 已 经 成 为 汉语 里 的 常用 表达 式 。 虽 然 在 汉语 原创 文本 里 仅 
检索 到 两 个 ( 随 着 季节 的 推移 、 随 着 时 间 的 推移 ) ,频次 不 高 。 但 在 CCL 语料库 中 ， 
却 检索 到 503 次 (其 中 在 非 翻 译作 品 中 出 现 402 次 )。 这 说 明 , 随 着 时 间 的 推移 已 
经 成 为 汉语 表达 时 间 变 化 的 常用 形式 , 它 的 频繁 使 用 应 归功 于 翻译 。 


“是 (不 ) 可 能 (的 )” 


“是 (不 ) 可 能 (的 )” 的 主要 功能 是 表达 命题 态度 , 它 在 汉语 翻译 语言 中 的 使 用 
频率 明显 高 于 原创 文本 。 表 8. 3 是 英汉 翻译 子 库 中 的 检索 结果 。 
R83 “是 (不 ) 可 能 (的 )" 结 构 在 英文 源 语 中 的 对 应 项 

原 语 对 应 词 | POSSIBLE | CAN | LIKELY | WILL | Might | Probable | Incapable | 无 对 应 | 合计 

频次 41 10 5 2 2 1 1 3 67 i 


在 原创 文本 库 里 ,“ 是 (不 ) 可 能 (的 )” 只 出 现 17 次 , 均 出 现在 政论 文本 里 。 而 
且 , 该 结构 式 多 以 “是 (不 ) 可 能 的 ”形式 置 于 句 末 ,很 少 使 用 扩展 式 。 总 之 ,这 个 结 
构 在 汉语 中 使 用 频率 低 , 适 用 范围 窄 ,使 用 方式 也 比较 单一 。 

在 翻译 文本 里 ,“ 是 (不 ) 可 能 (的 )” 对 应 于 英文 POSSIBLE 类 语词 。 这 种 对 应 
性 可 以 扩展 到 其 他 与 之 意义 相近 的 词 项 上 去 ,用 法 和 适用 范围 也 随 之 变 大 (可 以 对 
应 canywill,might,incapable)。 另 外 ,“ 是 (不 ) 可 能 (的 )” 在 句 中 使 用 扩展 式 的 频 
率 远 远 高 于 它 在 原创 文本 中 的 使 用 频率 。 比 如 ,在 下 面 的 汉语 译文 里 ,该 结构 被 大 
幅度 扩展 ,这 一 扩展 显然 是 受到 了 源 语句 子 铺 排 方式 的 影响 : 


(2) Earlier in life, Hester had vainly imagined that she herself might be 
the destined prophetess, but had long since recognized the impossibility that 
any mission of divine and mysterious truth should be confided to a woman 
stained with sin, bowed down with shame, or even burdened with a life-long 
sorrow. 

海 丝 特 年 轻 时 也 曾 虚妄 地 幻想 过 ,她 本 人 或 许 就 是 命定 的 女 先知 ,但 从 那 
以 后 ,她 早已 承认 了 :任何 上 界 的 神秘 真理 的 使 命 是 不 可 能 委托 给 一 个 为 罪 蓝 
所 下 污 \ 为 耻 情 所 压倒 或 者 甚至 为 终生 的 忧愁 而 沉 闽 的 女人 的 。 
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汉语 翻译 库 中 还 检索 到 另 一 些 高 频 使 用 的 表达 式 , 如 目的 是 为 了 、 在 某 种 程 
度 /意义 上 、…… 是 必要 的 ,很 久 很 久 以 前 、 更 确切 地 说 一 般 情 况 下 。 这 些 表达 式 
在 汉语 原创 文本 里 也 有 使 用 ,但 使 用 的 频率 远 远 低 于 汉语 翻译 文本 。 

不 难看 出 ,在 翻译 文本 中 一 些 高 频 运用 的 表达 形式 ,一 旦 被 广泛 接受 和 认可 ， 
就 可 能 进入 目的 语 ,成 为 多 个 近 义 表达 式 的 翻译 对 应 项 。 这 说 明 ,翻译 语言 倾向 于 
使 用 通用 的 表达 方式 处 理 源 语 中 形式 不 同 但 功能 相似 的 表述 ,这 可 以 部 分 证 实 翻 
译 共性 中 的 词汇 简化 现象 。 


8.4 小结 


语 料 考察 和 分 析 表明 ,汉语 翻译 语言 具有 以 下 特点 :1) 汉 语 翻译 语言 高 频 使 用 
的 单 音节 词 较 原创 文本 少 ;2) 汉 语 翻译 语言 里 的 介词 .连词 和 代词 在 使 用 的 数量 和 
频率 上 高 于 汉语 源 语文 本 ;3) 翻 译 语言 完全 可 能 使 用 原创 文本 不 太 常 用 的 词 或 多 
词组 合 形式 ,因此 不 能 简单 地 认为 原创 文本 在 词汇 运用 上 不 如 目的 语文 本 丰富 。 

本 章 的 统计 和 分 析 结果 对 翻译 共性 说 构成 质疑 。 首 先 ,汉语 翻译 语言 局 部 的 
显 化 与 一 些 词 项 (如 关系 代词 ,逻辑 连接 词 , 代 词 等 ) 的 隐 化 并 行 。 而 且 , 显 化 是 相 
对 的 ,就 英汉 翻译 而 言 ,汉语 翻译 语言 相对 于 汉语 原创 文本 而 言 显 化 ,相对 于 英文 
源 语 而 言 隐 化 。 显 化 的 方式 和 程度 显然 与 源 语 和 译 语 本 身 的 性 质 有 关 , 它 是 相对 
的 ,同时 又 具有 局 部 特征 。 其 次 ,汉语 翻译 语言 的 整体 特征 虽然 与 汉语 原创 语言 一 
致 ,但 前 者 结构 容量 扩 增 ,句子 偏 长 ( 见 第 7 章 ) ,因此 不 完全 支持 规范 化 。 再 次 , 翻 
译 语言 用 词 也 很 丰富 ,特别 是 高 频 使 用 源 自 源 语 的 一 些 表达 方式 ,而 且 句 段 较 原创 
语言 长 ,也 体现 不 出 翻译 共性 里 的 简化 特征 。 


第 9 章 


翻译 特征 分 析 : 显 化 与 隐 化 


近年 的 翻译 研究 开始 探讨 翻译 之 共性 ,翻译 中 的 隐 化 和 显 化 这 类 特征 可 能 涉 
及 翻译 共性 。 本 章 以 英汉 互 译 实例 分 析 翻 译 中 显 化 和 隐 化 现象 的 发 生 , 认 为 显 、 隐 
现象 由 语言 . 译 者 、 社 会 文化 等 多 种 因素 造成 ,并 着 重 讨论 了 语言 因素 和 译 者 因素 。 
分 析 发 现 隐 、 显 现象 的 发 生 和 隐 、 显 程度 可 能 与 语言 的 形式 化 程度 和 翻译 方向 
相关 。 


9.1 翻译 的 特征 与 共性 


译文 是 否 忠实 于 原文 ,这 可 以 说 是 检验 翻译 优 劣 的 永恒 标准 ,也 是 翻译 研究 、 
翻译 评论 的 一 个 主要 话题 。 但 语料库 特别 是 双语 语料库 的 出 现 , 引 发 出 人 们 对 翻 
译 研究 的 新 思考 。 例 如 近 十 多 年 里 国外 学 者 致力 探讨 的 翻译 之 共性 问题 ,以 及 与 
之 相关 的 译文 语言 特点 问题 。 这 是 翻译 研究 中 的 一 个 新 视角 。 语 料 库 的 发 展 为 这 
一 类 翻译 研究 提供 了 更 充分 的 资源 和 手段 。 

翻译 的 共性 , 即 译文 中 呈现 的 有 别 于 原文 的 一 些 典型 的 、 跨 语言 的 .有 一 定 普 
遍 性 的 特征 。 近 年 来 涉及 语料库 与 翻译 的 研究 报告 ,有 不 少 是 围绕 这 一 课题 展开 
的 ,如 以 下 值得 注意 的 文献 : 

(1) Baker(1993,1998) 通 过 对 “英语 翻译 语料库 ”TEC) 的 考察 ,提出 译文 语 
言 呈 简化 (simplification) 特 点 ; 

(2) Laviosa(1997,1998) 考 察 译 文 与 母语 在 词汇 使 用 上 的 不 同 ,发 现 译文 比 母 
语 使 用 更 多 的 高 频 词 ; 这 似乎 可 佐证 Baker 的 观点 , 因 高 频 词 数量 少 ,使 用 的 多 意 
味 着 词汇 简化 ; 

(3) veras(1998) 通 过 对 英语 和 挪威 语 互 译 的 考察 ,证 明 译文 语言 同 母语 相 
比 有 显 化 (explicitation) 倾 向 ; 

(4) 王 克 非 (2003) 基 于 对 汉 英 对 应 语料库 的 考察 ,发 现 译本 扩 增 现象 ,这 与 
veras(1998) 的 考察 结果 类 似 ; 

(5) Kenny(2001) 基 于 德语 /英语 文学 素材 平行 语料库 的 考察 ,发 现 创造 性 新 
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词 翻译 中 呈现 标准 化 /规范 化 (normalization) 趋 势 

(6) Kenny(1998) 通 过 对 原文 ,译文 的 语义 韵 分析, 发 现 同 母语 相 比 ,译文 语言 
有 “净化 ”(sanitisation) 现 象 ; 

(7) 但 是 译文 也 许 不 仅仅 有 “简化 ”“ 显 化 ”和 “净化 ”等 现象 ,我 们 认为 ,(a) 翻 
译 常常 遇 到 和 较 曲折 的 表达 ,从 而 可 能 更 多 地 使 用 母语 中 较 复杂 的 结构 或 句 式 ;通过 
语料库 考察 某 些 结构 的 分 布 ,我 们 发 现 汉语 译 文 比 汉语 原文 使 用 更 多 的 “把 ”字句 ， 
尤其 是 文学 译本 中 ;(b) 翻 译 过 程 中 会 不 同 程度 地 发 生 对 原文 的 模仿 ,从 而 使 译文 
变 得 复杂 化 、 完 长 化 ( 柯 飞 2003); 

(8) 陈 瑞 清 (2004) 从 自 建 “ 大 众 科学 英汉 平行 语料库 ?和 台湾 中 研 院 平衡 语 料 
库 原创 汉语 文本 对 部 分 汉语 关联 连词 的 使 用 情况 作 比较 ,发 现 汉 译本 有 从 意 合 转 
形 合 的 潜在 显 化 趋势 ; 

(9) 秦 洪 武 . 柯 飞 (2004) 通 过 个 案 考 察 “ 翻 译 语 ”(translationese) , 亦 即 既 非 原 
文 又 不 完全 是 母语 的 、 介 平原 文 和 译文 之 间 的 “ 语 际 语 ”, 并 注意 到 非 文 学 译本 比 文 
学 译本 在 结构 上 更 趋向 于 借鉴 原文 ; 

(10) 另外 ,Xiao & McEnery(2002) 则 通过 深入 的 研究 ,发 现在 “ 体 ” 标 记 的 使 
用 上 ,汉语 译文 比 汉语 原文 多 出 约 一 倍 。 

(11) 其 他 还 有 Ebeling(1998) 比 较 英语 和 挪威 语 在 存 现 句 使 用 上 的 特点 ,Maia 
(1998) 以 汉 英 对 应 语料库 观察 英语 和 葡萄 牙 语 在 人 称 主语 使 用 频率 上 的 差异 等 
( 王 克 非 2004b:182-184) 。 

对 以 上 涉及 翻译 共性 问题 的 探讨 ,无 论 在 国外 或 国内 ,还 只 是 初步 的 ,有 待 深 
人 的 ,但 却 展现 出 广阔 的 研究 前 景 ,有 助 于 我 们 加 深 对 翻译 和 翻译 过 程 的 认识 。 


9.2 翻译 中 的 显 化 现象 


显 化 (explicitness/explicitation) , 又 译 外 显 化 .明朗 化 .明晰 化 .明示 等 , 指 的 
是 “目标 文本 以 更 明显 的 形式 表述 源 文本 的 信息 ,是 译 者 在 翻译 过 程 中 增添 解释 性 
短语 或 添加 连接 词 等 来 帮助 译本 的 逻辑 性 和 易 解 性 ”(Shuttleworth & Cowie 
1997:55), Blum-Kulka 最 早 对 此 进行 系统 的 研究 ,她 认为 “ 译 者 对 于 原文 进行 解 
诺 的 过 程 可 能 导致 译 语文 本 比 源 语文 本 宛 长 ”; 这 一 宛 长 现象 “可 能 是 由 于 译 语 中 
提高 了 衔接 上 的 外 显 程度 造成 的 ”(Blum-Kulka 1986:19), 

这 一 假说 的 提出 ,在 西方 翻译 界 引 起 研究 兴趣 。 为 检验 显 化 假说 , Øverås 
(1998) 专 门 做 了 英语 /挪威 语 双语 语料库 调查 。 她 的 调查 涉及 40 个 小 说 片段 中 的 
前 50 个 句子 .其 中 20 本 是 挪威 语 作品 及 其 英语 译本 , 另 20 本 是 英语 作品 及 其 挪 
威 语 译本 。 她 主要 研究 该 假说 所 涉及 的 衔接 外 显 程 度 是 否 有 提高 。 她 同时 从 英 译 
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挪 、 挪 译 英两 个 方向 考察 ,并 排除 语言 系统 内 因 语 法 规则 引发 的 显 化 转移 ,同时 还 
细致 地 兼顾 到 与 之 相反 的 隐 化 现象 。 

她 的 发 现 是 , 英 译 挪 文本 中 共有 347 处 显 化 例证 ,平均 每 个 文本 17. 3 处 ; 挪 译 
英文 本 中 有 248 处 显 化 例证 ,平均 每 个 文本 12.4 处 。 显 见 后 者 少 于 前 者 。 这 些 显 
化 更 多 的 是 体现 在 词汇 上 。 如 英 译 挪 文本 中 的 347 处 显 化 ,其 中 112 处 体现 在 语 
法 上 ,而 词汇 方面 则 有 235 处 , 占 2/3 强 ; 挪 译 英 文本 中 的 有 82 处 是 语法 上 的 , 词 
汇 上 的 显 化 有 166 处 ,也 占 2/3。 区 别 只 是 显 化 在 英 译 挪 文 本 中 比 在 相反 方向 的 挪 
译 英 文本 中 更 为 显著 。 

这 一 现象 是 否 为 翻译 的 普遍 现象 ,还 需 多 种 语言 的 进一步 论证 。 贺 显 斌 
(2003) 就 英 译 汉 过 程 中 的 显 化 ( 显 化 ?现象 作 了 一 项 实证 研究 。 他 选取 网 ， 亨利 的 
短篇 小 说 The Last Leaf 及 其 汉 译 本 进行 显 化 现象 的 比较 。 他 考察 的 结果 是 : 英 
文 小 说 全 篇 134 句 , 译 成 汉语 后 显 化 程度 提高 的 有 79 句 , 占 58. 96% ,也 就 是 说 , 佐 
证 了 Overis(1998), 认 为 在 英 译 汉 过 程 中 有 显 化 现象 发 生 。 不 过 , 贺 的 考察 还 不 
够 充分 ,其 一 是 仅 做 了 个 案 考 察 ,篇 幅 也 较 小 ,其 二 是 未 考虑 译 者 等 因素 。 尽 管 如 
此 ,英汉 语言 之 间 的 互 译 多 少 存在 显 化 现象 这 一 点 应 是 可 以 明确 的 。 


9.3 ”翻译 中 的 显 和 隐 


翻译 中 的 显 化 现象 是 我 们 过 去 未 曾 注意 的 问题 ,其 实 也 存在 与 之 相反 的 隐 化 
(implicitness) 现 象 。 英 语 和 汉语 分 属 不 同 语系 ,形式 化 程度 或 形态 形式 相差 很 大 ， 
因此 在 不 同 的 翻译 方向 上 , 显 化 或 隐 化 的 表现 就 不 一 样 。 我 们 不 妨 举例 分 析 。 

从 英 译 汉 来 看 , 贺 显 研 (2003) 证 明了 有 较 高 程度 的 显 化 ,主要 是 通过 使 用 增 
词 \ 改 用 具体 词 转 换 人 称 、 转 换 辞 格 等 手段 。 但 是 鉴于 汉语 在 连接 词 等 衔接 手段 
和 指称 形式 上 都 不 同 于 英语 等 印 欧 语言 ,所 以 应 该 还 有 一 定 的 隐 化 现象 发 生 。 照 
顾 到 汉语 表达 习惯 而 做 相应 隐 化 处 理 的 翻译 通常 比 不 做 隐 化 的 仿 译 (imitation) 更 
为 地 道 。 

下 面 的 两 例 英 译 汉 ( 本 章 例句 除 特 别 注 明 外 均 取 自 北 外 的 汉 英 对 应 语料库 )， 
反映 出 汉语 译 者 由 于 受 原文 影响 而 产生 的 仿 译 ,并 使 译文 扩 增 : 


(1) It was one of the few gestures of sentiment he was ever to make, 

那 是 他 在 感情 方面 所 作出 的 很 少 的 几 次 表示 中 的 一 个 例子 。( 此 译 若 采 
取 隐 化 策略 ,减少 重复 ,避免 长 定语 , 则 可 译 得 更 符合 汉语 的 表达 习惯 ,他 很 少 
表露 感情 ,这 是 难得 的 一 次 


(2) Can you tell me where is your cereal section? 
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您 能 告诉 我 你 们 的 粮食 科 在 哪里 吗 ?此 译 若 采取 隐 化 策略 ,减少 不 必要 
的 人 称 代词 等 , 则 可 译 为 地 道 的 汉语 :请 问 粮食 科 在 哪儿 ?) 


关于 这 一 点 ,我 们 通过 回 译 可 以 看 得 更 清楚 。 王 克 非 (2003) 曾 举 贾 平 凹 一 篇 
散文 (节选 ) 的 英 译文 及 该 英 译 “ 回 译 ? 成 汉语 的 例子 。 该 例 显 示 , 因 语言 结构 的 需 
要 ,译文 经 显 化 而 扩 增 , 回 译 成 汉语 时 ,篇 幅 上 已 比 贾平凹 原文 多 出 90 字 , 增 幅 达 
57%。 试 分 析 该 片断 前 头 两 句 ; 


(3)a 伯父 家 盖 房 , 想 以 它 倒 山墙 ,但 苦于 它 极 不 规则 , 没 棱角 儿 ,也 没 平 
面 儿 ;《28 字 ) 

(3)b When Uncle’s family was building a house, we thought of using it 
to pile up a side of the house wall. This proved to be impossible, however, 
since the rock was of an extremely irregular shape, possessing neither sharp 
right angles nor any smooth, flat surfaces, 

(3)c (SCR REF OT, BATT AB BUA 2 — Ta (EIB AE E 
因为 这 块 岩 石 外 形 太 不 规则 , 既 没有 尖 利 的 直角 ,又 没有 光滑 的 平面 。(56 F) 


(3) b 英 译文 的 斜体 部 分 是 因 英文 表达 的 需要 比较 自然 地 “ 显 化 ”而 添加 上 去 
的 词语 ,如 连词 when, since,neither. . . nor、 主 语 we 等 ,而 且 原 文 隐 含 的 “未 能 用 上 
该 石头 ”之 意 也 显 化 出 来 了 :This proved to be impossible。(3)c 则 顺 着 英 ( 译 ) 文 
译 成 汉语 , 即 (3)b 中 显 化 的 斜体 部 分 顺 译 / 仿 译 为 (3)c 下 划 线 部 分 ;再 对 照 (3)a 
原文 , 则 可 以 看 出 , 若 回 译 的 (3)c 隐 化 处 理 (3)b 斜体 部 分 , 便 能 基本 回 到 地 道 的 汉 
语 原 文 。 

又 如 向 光 ( 见 “翻译 工作 坊 ”:http: // sts. nthu. edu. tw/transws) 批 评 林 宗 宪 所 
译 (毛泽东 兴 台 北 :左岸 出 版 ,2001) 。 原 著 为 美国 著名 汉学 家 史 景 迁 (J. Spence) F 
1999 年 出 版 的 Mao Zedong (New York: Viking Penguin) 。 向 光 批评 林 译 为 了 “省 
事 ”, 对 西 文 著作 中 引用 的 汉语 未 查找 原文 , 自 译 引文 ,结果 与 毛泽东 原文 相差 
甚 远 。 

请 看 史 景 迁 书 中 引用 的 毛泽东 《民众 的 大 联合 ) 中 一 段 文字 的 原文 : 


Da MERK, RBM. KALB RAL. Wl 我 们 知 
道 了 ! 我 们 觉醒 了 ! 天 下 者 我 们 的 天 下 。 国 家 者 我 们 的 国家 。 社 会 者 我 们 的 
社会 。 我 们 不 说 , 谁 说 ? RMAF EF? 刻不容缓 的 民众 大 联合 ,我 们 应 该 
积极 进行 ! (收入 《毛泽东 早期 文稿 ), 湖 南 出 版 社 ,1990, 第 390 页 ) 
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(4)b 英 译文 ( 史 ) : 

From Lake Dongting to the Min River，the tide rides ever higher. 
Heaven and earth are aroused by it, the wicked are put to flight by it. Ha! 
We know it! We are awakeded! The world is ours, the state is ours, society 
is ours, If we do not speak, who will speak? If we do not act, who will act? 
We must act energetically to carry out the great union of the popular masses, 
which will not brook a moment’s delay! 

(De 中 译文 ( 林 ) : 

从 洞庭 湖 到 明湖 , 浪潮 更 测 涌 。 天 地 因而 悲愤 ,邪恶 者 因而 声势 高 张 。 
啊 ! 我 们 知道 了 ! 我 们 惊醒 了 ! 世界 是 我 们 的 ,国家 是 我 们 的 ,社会 是 我 们 
的 。 假 如 我 们 不 说 话 , 谁 能 为 我 们 说 话 ?假如 我 们 不 行动 , 谁 能 为 我 们 行动 ? 
我 们 必须 有 活力 地 行动 以 实现 广大 群众 大 联合 的 理想 ,而 那 是 刻不容缓 的 事 ! 
( 林 宗 宪 译 ,87-88 FL) 


史 景 迁 不 愧 为 精通 英 、 汉 语 和 中 国 现代 史 的 专家 ,其 英 译文 颇 显 功夫 , 读 来 雏 
SAD ,与 毛泽东 原文 不 相 伯 仲 。 而 林 译 (4)e 不 仅 多 有 错误 (如 该 文中 楷体 部 
分 ) ,而且 “使 毛泽东 原来 力道 十 足 的 语言 风味 尽 失 ”。 特 别 是 两 个 假设 条 件 句 ( 斜 
体 部 分 ) ,因为 有 了 “假如 ……” 而 力道 顿 失 ,韵味 全 无 ( 试 比较 原文 的 隐 含 假设 条 件 
句 )。 

这 又 令 人 想到 2005 年 4 月 台湾 的 中 国 国民 党 主席 连战 在 北京 大 学 演讲 时 ,以 
汉语 翻译 引用 美国 前 总 统 罗 纳 德 。 里 根 的 一 段 话 :“( 有 些 事 情 ) 如 果 我 们 不 去 做 ， 
谁 去 做 ?如 果 我 们 现在 不 做 ,什么 时 候 做 ?” 

这 句 引 语 带 有 明显 的 翻译 腔 , 即 对 原文 的 仿 译 。 若 采用 隐 化 策略 加 以 改造 的 
话 ,其 译文 应 是 类 似 上 面 毛泽东 的 那 段 话 :“ 我 们 不 做 , 谁 做 ? 现在 不 做 ,什么 时 候 
做 ?” 显 化 出 来 的 “如 果 ” 以 及 后 一 个 代词 “我 们 ”是 没有 必要 的 。 再 看 汉 译 英 的 
例证 。 


《5)“ 靠 山 吃 山 , 靠 水 吃水 ,我 老汉 靠 沙子 ,当然 要 吃 沙 1” 

“If you live on a mountain, you live off the mountain; if you live by the 
water, you live off the water. I live on the sand, and I’Il live off the sand. ” 

(6)“ 没 有 招待 所 有 店 , 没 店 有 生产 队 , 有 老乡 窗 洞 .” 

“If there’s no guesthouse there’ Il be an inn;if there’s no inn there’ Il be 
the cave home of a farmer in the production brigade. ” 


(7) 国家 这 么 大 ,这 么 穷 ,不 努力 发 展 生产 ,日 子 怎么 过 ? 
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In a country as big and as poor as ours, if we don’t try to increase 


production, how can we survive? 


例 (5) 至 例 (7) 是 汉 译 英 , 因 英文 表达 的 需要 ,汉语 原文 的 隐 性 条 件 句 译 成 英语 
时 都 加 上 了 过 ,成 为 显 性 条 件 句 。 如 果 按 此 显 性 英语 条 件 句 回 译 成 汉语 (或 将 类 似 
的 英文 语句 译 成 汉语 ) ,通常 会 仿 译 成 为 汉语 的 显 性 条 件 句 ,并 增添 其 他 连词 和 人 
称 代词 (如 仿 译 英文 斜体 部 分 )。 若 知道 做 隐 化 处 理 , 才 有 可 能 回 到 地 道 的 汉语 原 
文 。 如 下 面 的 例句 ， 


(8)a With my present level (of French), I can not read French newspaper 
easily. 

Ob 以 我 现在 的 (法 语 ) 水 平 , 我 还 不 能 轻松 地 读 法 文 报纸 。 

(8)c 我 的 法 语 ,看 报 很 吃力 。 

(9)a If you take this medicine, your illness will surely be cured, 

(9)b 你 要 是 服用 这 个 药 , 你 的 病 肯定 能 治 好 。 

(9)c 这 药 吃 了 准 好 。 

(10)a You needn’t care about the affairs in the home. 

(10)b 你 不 必 担心 家 里 的 事 。 

(10)c 家 里 的 事 , 不 用 你 管 。 


对 于 (8)a,(8)b 是 仿 译 , (8)c 做 隐 化 处 理 ,以 汉语 的 主题 句 译 之 。 对 于 (9)a， 
(Db 是 仿 译 ,(9)c 做 隐 化 处 理 , 以 汉语 隐 性 条 件 句 译 之 ,并 省 去 人 称 代词 。 对 于 
(10)a,(10)b 是 仿 译 ,(10)c 以 汉语 的 宾语 前 置 主题 句 译 之 。 由 此 可 见 , 英 译 汉 时 
做 一 定 的 隐 化 处 理 ,译文 会 更 地 道 , 也 比较 简洁 。 仿 译 则 将 外 语 的 表达 法 引入 汉 
请, 对 于 汉语 来 说 ,已 经 在 形式 上 显 化 了 , 即 本 可 以 隐 化 表达 的 意思 外 在 地 显示 出 
来 了 。 这 一 类 情况 在 英 译 汉中 表现 得 非常 明显 和 频繁 。 

除了 上 述 有 代表 性 的 例句 外 ,我 们 对 汉 英 对 应 语料库 中 80 多 万 汉字 的 汉 译 英 
语 料 (汉语 为 原文 ) 和 近 80 万 汉字 的 英 译 汉语 料 (汉语 为 译文 ) 加 以 考察 ,发 现 以 下 
表示 时 间 的 连词 词组 的 用 法 在 汉语 原文 和 汉语 译文 中 出 现 的 频率 达 不 相同 ， 

在 汉 译 英语 料 (汉语 原文 ) 中 ,在 …… 时 20 处 ,在 …… 时 候 99 处 , 当 …… 时 6 
处 , 当 …… 时 候 23 Ab, FE 148 Ab; 

而 在 英 译 汉语 料 (汉语 译文 ) 中 ,在 …… 时 279 处 ,在 …… 时 候 140 Ab, 当 …… 
时 80 处 , 当 …… 时 候 18 Hh; FE 527 处 。 

表示 假设 条 件 的 连词 用 法 在 汉语 原文 和 汉语 译文 中 也 相差 很 远 ， 
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“如 果 ” 句 :汉语 原文 中 仅见 44 名 ,汉语 译文 中 多 达 393 句 。“ 要 是 ”名 ,汉语 原 
文 语 料 中 有 81 处 ,汉语 译文 语 料 中 出 现 139 处 。 

还 有 表示 结果 的 连词 “以 致 ”在 汉语 原文 和 译文 中 的 使 用 差别 很 大 : 

“以 致 ”名 :上 述 汉 译 英 语 料 中 未 见 一 句 (0) , 英 译 汉语 料 中 见 到 20 句 。 

这 些 数据 说 明 ,与 原文 语言 相 比 ,译文 语言 确实 有 表达 上 的 特点 ,是 无 形 中 受 
到 的 源 语言 影响 ,同时 也 说 明 翻 译 中 采取 隐 化 策略 之 必要 。 

此 外 ,从 上 述 分 析 可 以 看 出 , 隐 化 和 显 化 与 翻译 方向 有 一 定 关系 ,至 少 在 不 同 
翻译 方向 上 , 隐 化 和 显 化 程度 是 不 同 的 。 结 合 Overas(1998) 的 考察 ,我 们 不 妨 假 
设 :由 形式 化 程度 较 高 (或 形态 繁复 ?的 语言 翻译 成 形式 化 程度 较 低 的 语言 ,如 由 挪 
威 语 翻译 成 英语 ,或 由 英语 翻译 成 汉语 , 显 化 现象 发 生 递减 ,而 隐 化 现象 发 生 递增 。 
若是 相反 的 翻译 方向 , 则 显 化 递增 , 隐 化 递减 。 这 一 假设 有 待 于 进一步 的 语料库 
验证 。 


9.4 广义 上 的 翻译 显 化 现象 


作为 一 种 翻译 现象 , 显 化 (以 及 隐 化 ) 不 应 只 是 狭义 地 指 语言 衔接 形式 上 的 变 
化 ,还 应 包括 意义 上 的 显 化 转换 , 即 在 译文 中 增添 了 有 助 于 译文 读者 理解 的 显 化 表 
达 , 或 者 说 将 原文 隐 含 的 信息 显 化 于 译文 中 ,使 意思 更 明确 ,逻辑 更 清楚 。 这 也 是 
翻译 特有 的 现象 。 

许 国 璋 论述 翻译 时 , 曾 提出 对 哲学 著作 的 翻译 应 采取 “ 通 译 ”、“ 切 译 ” 或 “并 
译 ”"“ 释 译 "方法 (1991:248,262) 。 他 力主 译文 必须 通 脱 、 醒 露 , 译 出 词 的 文化 史 涵 
义 。 他 特地 翻译 罗素 (西方 哲学 史 》 以 为 其 “ 阑 译 ”示范 。 他 解释 说 , feudal 不 译 
“封建 ”, 译 “ 拥 据 领 地 (之 诸侯 )”;anarchy 不 译 “ 无 政府 ”"( 当 时 无 中 央 政府 ) ,而 译 
“RAB” adventure 不 译 “ 冒 险 ”, 或 译 “ 猫 奇 于 远方 ”, 或 译 “ 探 无 涯 之 知 ”, 视 上 
下 文 而 定 , 此 而 不 济 , 则 作 “ 释 译 ” 以 为 助 。 例 如 antiquity 不 译 “ 古 代 ”, 译 “希腊 罗 
I”. XAN fame and beauty ,在 文艺 复兴 时 期 有 特殊 涵义 , 今 试 译 “ 享 盛誉 于 邦 国 ， 
创 文艺 之 美 ”asceticism 译 “ 绝 欲 弃 俗 , 攻 苦 食 淡 之 说 教 ”; prudential arguments 
译 “ 保 身家 保 名 誉 之 考虑 "(1991:248) 。 

这 些 并 不 是 Overas(1998) 所 讨论 的 衔接 手段 上 的 显 化 ,而 是 意义 上 的 显 化 ， 
但 这 也 是 翻译 中 常见 的 情形 ,同意 值得 探讨 。 翻 译 家 的 责任 不 仅 在 于 通过 语言 作 
翻译 介绍 ,他 还 需要 为 自己 的 文化 引进 相应 的 概念 系统 ,为 读者 更 好 地 理解 作品 提 
供 背景 知识 。 我 们 再 看 两 例 许 氏 译文 : 


(11) Gunpowder strengthened central government at the expense of feudal 
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nobility. 

(11)a 火药 用 于 争战 ,中 央 政府 因 之 以 强 , 拥 据 领地 之 公 候 因 之 而 弱 。 

(ll1)b 火药 消灭 了 封建 贵族 而 巩固 了 中 央 集 权 政治 。( 何 、 李 译 ,p. 589) 

(12) When Constantinople, the last survival of antiquity, was captured 
by the Turks, Greek refugees in Italy were welcomed by humanists, Vasco 
da Gama and Columbus enlarged the world, and Copernicus enlarged the 
heavens, 

《12)a [十 五 世纪 中 j] 君 士 坦 丁 堡 为 土耳其 所 占 。 自 希腊 罗马 之 衰 ,古文 
化 残存 于 世 , 仅 君 土 坦 丁 堡 一 地 。 既 陷 , 寅 居于 君 土 坦 丁 堡 之 希腊 学 人 , 相 率 
流亡 意大利 ,意大利 倾慕 希腊 人 文 之 学 者 , 迎 为 上 宾 。 达 迦 玛 绕 好 望 角 抵 印 
度 ,哥伦布 西行 发 现 新 地 ,而 世界 为 之 扩大 。 哥 白 尼 立 日 中 心 之 说 ,而 宇宙 为 
之 扩大 。 

(12)b 当 君 士 坦 丁 保 ,这 个 古代 最 后 的 残余 ,被 土耳其 人 攻陷 后 , 逃 往 意 
大 利 的 希腊 难民 曾 受 到 人 文学 者 的 欢迎 。 瓦 斯 寇 。 达 。 伽 马 和 哥伦布 扩大 了 
世界 ,而 哥 白 尼 扩 大 了 天 界 。( 何 、 李 译 ,p. 589) 


对 照 原文 ,译文 (11)a 和 (12)a 在 意思 上 充分 显 化 ,原文 隐 含 的 或 在 其 文化 上 
不 言 自明 的 内 容 , 已 为 译 者 以 加 词 、 变 通 、 盖 释 等 方法 在 译文 中 显 化 出 来 ,形成 一 种 
阑 译 , 比 直译 (如 例 (11)b 和 例 (12)b 的 译文 ) 甚 至 比 直接 读 原文 更 清晰 `. 易 慌 。 例 
如 读 例 (11)b, 读 者 不 容易 弄 慌 火药 怎样 消灭 封建 贵族 而 巩固 中 央 集 权 , (11)a 添 
加 “用 于 争战 ”, 将 原文 隐 含 的 因果 关系 之 意 显 化 ,就 明白 易 慌 了 。 例 (12) 更 是 如 
此 。 相 比 于 bsa 的 下 划 线 部 分 添加 了 不 少 文化 背景 上 的 解释 ,如 “最 后 的 残余 ” 解 
释 为 “古文 化 残存 于 世 , 仅 君 士 坦 丁 堡 一 地 ”, 使 人 明白 残余 指 文化 之 残存 ; 达 迦 玛 、 
哥伦布 . 哥 白 尼 如 何 使 世界 扩大 ? a 将 其 背景 显 化 在 译文 中 :“ 绕 好 望 角 抵 印度 ”， 
“西行 发 现 新 地 ”“ 立 日 中 心 之 说 ”, 读 者 于 是 明白 。 这 种 显 化 现象 无 疑 与 译 者 的 翻 
译 主张 相关 :翻译 目的 ,在 于 便利 不 懂 外 文 之 读者 ,如 不 懂 外 文 之 读者 读 之 不 懂 ， 
翻译 者 不 能 说 尽 到 责任 。”( 许 国 璋 1991:248) 


9.5 小 结 


翻译 中 的 隐 和 显 ,由 多 种 因素 造成 ,如 1) 语 言 因素 ; 隐 、 显 现象 的 发 生 和 隐 、 显 
程度 可 能 与 语言 的 形式 化 程度 或 形态 形式 和 翻译 方向 相关 。 例 如 汉语 同 英语 等 印 
欧 语 言 相 比 ,其 词汇 .语法 衔接 上 的 显 化 度 都 比较 低 , 汉 译 英 时 会 比 英 译 汉 时 更 多 
地 呈现 形式 上 的 “ 显 化 ”, 而 英 译 汉 时 则 呈现 更 多 的 模仿 式 的 “ 显 化 ”。2) 译 者 因素 ; 
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负责 的 译 者 在 穿梭 于 两 种 语言 之 间 进 行 协调 时 ,总 会 尽量 减少 信息 传输 过 程 中 的 
损耗 和 丢失 ,便于 读者 的 理解 和 吸收 。 但 另 一 方面 ,有 些 译 者 因 其 能 力 上 的 不 足 ， 
在 翻译 中 对 原文 亦 步 亦 趋 地 仿 译 ,也 会 导致 译文 过 度 “ 显 化 ”。3) 社 会 文化 因素 ; 翻 
译 涉及 的 两 种 语言 在 社会 和 文化 上 的 差距 越 大 ,可 能 越 需 要 解释 性 的 “ 显 化 ”。4) 
文本 因素 ;小 说 文本 、 科 学 文本 、 政 论文 本 、 新 闻 文本 、 应 用 文 文本 等 在 翻译 中 的 显 、 
隐 程 度 可 能 有 别 , 本 章 未 及 论述 。 


第 10 章 


翻译 汉语 的 词汇 简化 与 显 化 


本 章 通 过 “通用 汉 英 对 应 语料库 ”中 翻译 汉语 与 原创 汉语 语 料 的 分 析 和 对 比 ， 
考察 翻译 汉语 区 别 于 汉语 原创 语 料 的 词汇 使 用 特征 。 语 料 库 研究 表明 :无 论 是 文 
学 还 是 非 文 学 语 料 , 翻 译 汉语 与 原创 汉语 相 比 ,具有 词语 变化 度 偏 低 , 词 汇 密度 偏 
低 \ 虚 词 显 化 . 指 代 方式 显 化 、 常 用 词 频率 增加 等 特征 。 本 章 还 就 这 些 特征 探讨 了 
“翻译 共性 ”问题 。 


10.1 翻译 语言 的 特征 与 翻译 共性 


翻译 涉及 原 语 和 译 人 语 两 种 语言 ,所 产 译文 必然 与 这 两 种 语言 及 其 文化 相关 。 
译文 再 “异化 ”, 也 不 可 能 全 部 照搬 原 语 而 不 顾 译 人 语 的 语言 规则 规范 ;译文 再 “ 归 
化 ”, 也 总 会 与 译 人 语 存 在 某 些 差异 。 这 些 差 异 不 会 以 明显 不 符合 目的 语 语法 规则 
的 形式 出 现 , 而 往往 以 多 少 有 些 异常 的 形式 偏离 语言 使 用 的 规范 (Toury 1980: 
226) 。 我 们 把 译文 语言 与 译 人 语 语言 规范 的 差异 称 为 “翻译 的 特征 ”(features of 
translation) ,并 由 此 探讨 “翻译 共性 ”(translation universals) 。 

对 翻译 自身 特征 的 系统 研究 仅 有 十 几 年 历史 。Baker(1993)、Kenny(2001) 、 
Laviosa(2002) .Olohan(2004) 等 先后 采用 语料库 语言 学 的 方法 来 描述 翻译 英语 的 
特征 。 他 们 据 此 所 揭示 的 翻译 共性 主要 是 :1) 简 化 (simplification) , 指 “ 译 者 无 意 
识 地 简化 语言 或 信息 或 两 者 兼 而 有 之 ”(Baker 1996:176) 。 换 言 之 , 即 翻译 文本 比 
原创 文本 的 语言 更 简单 ,例如 用 词 范 围 缩小 .常用 词 增多 、 句 型 简化 等 。2) 显 化 
Cexplicitation) , 指 对 原 语 中 暗含 的 、 需 从 上 下 文中 推导 出 的 信息 在 译 语 中 予以 明 
示 (Vinay & Darbelnet 1958/1995)。 显 化 最 主要 的 表现 是 :扩展 句子 和 语 篇 ;增添 
修饰 词 .限定 词 和 连接 词 ,增添 额外 信息 ,增添 解释 语 ,代词 明示 等 。3) 范 化 
(normalization) , 指 译 者 消除 原文 独特 的 文本 特征 ,用 译 人 语 中 典型 .规范 的 方式 
来 生产 译文 ,而 且 译 文 可 能 比 译 入 语 的 原创 文本 更 加 “规范 ”。 主 要 表现 为 :特色 词 
减少 ,常用 词 增多 ,标点 符号 更 规范 ,繁琐 ,奇异 的 句子 减少 ,逻辑 性 更 强 等 。 除 上 
述 三 个 翻译 共性 外 ,个 别 研究 者 还 提出 了 删 减 原文 中 的 重复 . 译 和 人 语 特 征 夸大 化 等 
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特征 。 概 言 之 ,翻译 特征 可 描述 为 语言 更 简单 、 易 读 性 更 强 (简化 ) ;歧义 更 少 、 表 达 
` 更 清楚 ( 显 化 ); 更 符合 译 入 语 规范 ( 范 化 ); 同 时 ,翻译 文本 的 独创 性 可 能 降低 ,译文 
偏向 于 译 语文 化 中 的 可 接受 性 。 学 者 们 倾向 于 将 这 些 翻译 特征 逐步 论证 为 翻译 共 
性 ,这 一 点 自然 需要 更 多 的 双语 翻译 语 料 的 验证 。 
上 述 翻译 特征 研究 主要 在 英语 为 主 的 欧洲 语言 间 的 翻译 中 进行 。 我 国 的 语 料 
库 翻 译 学 经 过 前 几 年 的 介绍 阶段 ( 诀 七 一 2000; 张 美芳 2002; 柯 飞 2002; HH Sb HE 
2005 等 ) 后 ,也 开始 进行 基于 汉 英 对 应 语料库 的 相关 研究 。 本 章 即 利用 北京 外 国 
语 大 学 “ 汉 甘 对 应 语料库 ”对 翻译 汉语 (包括 文学 和 非 文 学 语 料 ) 不 同 于 原创 汉语 
( 指 汉 语 原创 语 料 ) 的 词语 使 用 特征 进行 描述 和 分 析 。 需 说 明 的 是 ,本 章 的 出 发 点 
是 采用 语料库 方法 来 验证 翻译 汉语 是 否 存 在 翻译 共性 或 区 别 性 特征 的 假设 。 本 章 
的 比较 是 在 同 为 汉语 的 翻译 和 非 翻译 的 类 比 语料库 之 间 进 行 ,与 传统 对 比 语言 学 
在 语言 间 的 比较 有 区 别 。 


10.2 翻译 汉语 的 词汇 特征 


10.2.1 词语 变化 度 


词语 变化 度 是 指 相同 长 度 的 语 料 中 不 同 词语 的 数量 ,可 以 作为 语 料 难 易 程度 
的 衡量 因素 之 一 ,以 语料库 的 类 符 形 符 比 (type/token ratio,TTR) 来 衡量 。 类 符 形 
符 比 指 特 定语 料 中 类 符 (type) 与 形 符 (token) 的 比率 。 类 符 是 语料库 中 不 同 的 词 
语 ; 形 符 是 所 有 的 词 形 。TTR 值 越 大 说 明 该 文本 所 使 用 的 不 同 词汇 量 越 大 ,反之 
则 不 同 词汇 越 少 。 但 由 于 一 种 语言 在 特定 时 期 的 词汇 量 是 有 限 的 ,语料库 容量 不 
断 扩大 , 形 符 数 持续 增加 ,但 类 符 数 却 不 一 定 会 增加 ;语料库 容量 越 大 , 形 符 类 符 比 
反而 会 越 来 越 小 ,因此 不 同 容量 的 语料库 的 形 符 类 符 比 不 具备 可 比 性 。 故 一 般 用 
标准 类 符 形 符 比 (STTR) 来 衡量 语料库 的 词汇 变化 , 即 按 一 定 的 长 度 分 批 计算 文 
本 的 类 符 形 符 比 ,再 求 均值 类 符 形 符 比 反映 文本 的 信息 量 的 大 小 。 用 Wordsmith 
Tool(WS) 可 自动 计算 TTR 和 STTR。 表 10. 1 为 使 用 WS4. 0 统计 的 语料库 基本 
信息 CSTTR 计算 基数 为 100) : 


O 语料库 容量 为 3000 万 字 词 , 由 翻译 \ 百 科 、 专 科 和 对 译 语句 等 四 个 子 库 构 成 。 其 中 翻 
译文 本 库容 量 为 2000 万 字 词 , 英 译 汉 占 60%; 汉 译 英 占 40%% ,分 别 包含 文学 和 非 文学 语 料 。 全 
部 语 料 进行 了 句 对 齐 和 词性 标注 。 文 学 语 料 以 小 说 为 主 。 本 章 主要 使 用 四 个 子 库 的 语 料 :1) 汉 
语文 学 原创 语 料 ;2) 汉 语文 学 翻译 语 料 ;3) 汉 语 非 文学 原创 语 料 ;4) 汉 语 非 文学 翻译 语 料 。 
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表 10.1 各 子 语料库 的 词语 变化 度 比较 中 


文 学 非 文学 

原创 汉语 翻译 汉语 原创 汉语 翻译 汉语 
形 符 数 (token) 403418 564 390 302 303 460887 
类 符 数 (type) 14771 16340 10151 17111 
TTR 3.66 | 2.9 3.4 3.77 
STTR 71, 84 70.79 66. 95 70. 87 
STTR 标准 差 29. 00 28. 28 32. 34 30. 17 

+ 
平均 词 长 (字数 ) 1. 28 1, 32 1.55 1.46 
+- -二 十 

词 长 标准 差 1 0.55 0. 73 0. 67 


表 10. 1 列举 了 反映 词语 变化 的 各 项 指标 。 总 体 特 征 是 :文学 语 料 与 非 文学 
语 料 的 表现 呈 相 反 趋 势 一 汉语 文学 语 料 中 翻译 汉语 的 TTR 和 STTR 小 于 原 
创 汉语 ;而 非 文学 语料库 翻译 汉语 TTR 与 STTR 大 于 原创 汉语 。 这 意味 着 : 文 
学 语 料 的 词语 变化 趋势 支持 “简略 化 ”的 假设 , 即 汉语 文学 翻译 语 料 显示 使 用 较 
少 的 词汇 ,而 原创 文学 倾向 于 使 用 较 多 的 词汇 。 词 语 变化 特征 表明 :汉语 文学 翻 
译 语 料 支 持 “ 简 化 ”共性 假设 (Laviosa 1998, 2002; $ SBM 2007) ,而 汉语 非 文学 
翻译 语 料 似乎 不 支持 这 一 假设 。 关 于 后 者 ,我 们 分 析 是 所 用 语料库 中 非 文学 原 
创 汉 语 语 料 的 选材 稍 显 单一 , 主要 为 政府 文件 类 语 料 ( 共 199 个 文件 ); 而 翻译 汉 
语 则 涉及 科技 、 经 济 法律 .医疗 等 各 个 领域 ( 共 400 个 文件 ) 。 两 个 语料库 的 规 
模 和 选材 有 差距 ,因而 可 比 性 略 差 。 尽 管 文学 语 料 的 词语 变化 度 支持 翻译 简化 
的 假设 ,但 由 于 语料库 之 间 的 类 符 形 符 比 的 差距 并 不 特别 悬殊 ,这 些 差异 还 可 能 
受 语料库 工具 的 精度 和 语 料 取样 的 范围 的 影响 ,所 以 它 所 能 说 明 词 语 简化 的 程度 
有 限 。 


10.2.2 词类 频率 分 布 


本 章 所 使 用 的 四 个 语料库 都 做 过 词性 赋 码 ,因此 得 以 对 各 子 语料库 的 各 类 词 
性 进行 全 面 的 统计 分 析 。 我 们 用 PowerGrep3. 0 检索 了 语料库 中 全 部 43 个 POS 


D WS 统计 的 数据 与 采用 PowerGrep3. 0 等 文本 检索 工具 检索 的 数据 有 一 些 差异 。 这 可 
能 是 由 于 WS 内 部 对 汉字 形 符 计算 的 方式 有 所 不 同 。 本 章 对 相同 数据 采取 完全 相同 的 工具 以 
确保 词 表 数据 具有 可 比 性 。 
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标记 的 频次 ,并 依据 各 子 语料库 的 实际 形 符 标准 化 了 各 种 词类 的 每 百 万 词 频率 0 
AK 10. 2) 。 为 了 分 别 统计 实 词 和 虚词 的 频率 ,本 章 在 表 中 用 “一 ”表示 虚词 。 鉴 
于 代词 属实 词 或 虚词 还 存在 争议 ,及 代词 在 翻译 汉语 中 的 特殊 表现 ,本 章 用 “x” 单 
列表 示 。 以 下 分 别 从 词汇 密度 .虚词 形 符 比 ,代词 形 符 比 三 个 方面 具体 分 析 翻 译 汉 
语 的 词类 频率 分 布 特征 。 


表 10.2 各 子 语料库 词类 频次 比较 (每 百 万 词 ) 


文 学 非 文学 

原创 汉语 翻译 汉语 原创 汉语 翻译 汉语 
动词 206 851 200358 212206 203975 
名 词 175 609 151910 240423 232432 
副词 85898 75695 52778 57232 
形容 词 44 232 41687 41843 | 40492 
数 词 30895 29768 35130 34966 
量词 25297 23942 17319 20427 
代词 *74307 *101141 *41856 *53154 
助词 一 70697 一 83437 一 75005 一 84320 
介词 一 26064 一 37692 一 37545 一 45807 
连词 一 17359 一 21950 一 28944 一 33594 
语气 词 一 14450 —11876 一 4044 一 2673 
叹 词 一 1808 一 1710 一 93 一 138 
合计 773467 781166 787188 809210 


10.2.2.1 词汇 密度 

词汇 密度 (lexical density) 有 两 种 计算 方法 。 一 种 是 以 TTR 值 作为 词汇 密度 
( 杨 惠 中 2002:168) 。 一 般 认为 ,这 种 词汇 密度 高 于 60% 一 70% 为 密度 较 高 , 低 于 
40%% 一 50% 为 密度 较 低 。 这 种 词汇 密度 将 词语 的 变化 性 等 同 于 词汇 密度 ,但 如 上 
所 述 ,TTR 对 语料库 容量 和 选材 十 分 敏感 ,不 能 真实 反映 词语 变化 度 。 另 一 方面 ， 
STTR 也 不 能 完全 反映 篇 章 的 信息 量 ,原因 是 STTR 统计 的 类 符 包 括 实 义 词 和 功 


D 本 节 的 某 一 词类 包括 该 POS 的 全 部 赋 码 ,例如 :形容 词 包括 POS 一 a,ad,ag,an; 名 词 包 
括 POS=n,ng,nr,ns,nt,nx,nz 等 。 全 部 词性 赋 码 标记 集 (Tagset) 参 看 (北大 汉语 文本 词性 标注 
标记 集 》。 
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能 词 ,过 度 修饰 的 篇 章 由 于 功能 词 的 增加 也 可 能 提高 STTR 值 ,但 并 不 意味 着 该 语 
篇 信息 量 的 增加 。 

另 一 种 是 J，Ure(1971) 和 Michael Stubbs(1986) 提 出 的 方法 , 即 统计 实 词 形 
符 在 总 形 符 数 中 的 比例 。 英 语 的 实 义 词 (lexical word 或 content word) 指 具有 稳 
定 词义 的 词语 ,包括 名 词 、 动 词 ,形容 词 和 副词 等 词类 。 与 之 相对 的 是 功能 词 
(unction word) , 指 不 具备 稳定 词义 或 意义 模糊 而 主要 起 语法 功能 作用 的 词语 , 包 
括 介词 .连词 . 冠 词 ,助动词 等 词类 。 汉 语词 类 划分 和 实 词 与 虚词 的 区 分 至 今 还 存 
在 争议 9。 本 章 用 前 一 种 方法 词汇 密度 来 考察 和 比较 翻译 汉语 与 原创 汉语 在 信息 
量 上 的 差异 和 难 易 度 , 同 时 也 采取 第 二 种 方法 , 即 在 具体 统计 中 把 名 词 动词 .形容 
词 .副词 , 数 词 .量词 等 六 个 “具有 稳定 词义 ”的 词类 作为 实 词 。 将 汉语 中 起 语法 功 
能 的 助词 .介词 .连词 .语气 词 . 叹 词 等 视 为 虚词 。 而 “ 半 虚 词 ” 代 词 ( 王 力 ) 的 意义 必 
须 依靠 与 其 同 指 的 名 词 才 能 确定 ,本 章 认 为 它 不 应 算 作 具 有 “稳定 的 词义 ”。 但 是 ， 
我 们 在 对 各 词类 频率 及 比例 的 统计 中 发 现 ,汉语 文学 翻译 中 代词 的 使 用 与 非 翻译 
语 料 具有 显著 的 区 别 , 故 本 章 对 代词 单列 统计 并 专门 讨论 。 表 10. 3 中 列举 了 三 类 
词 的 频率 在 各 子 语料库 中 的 比例 。 


表 10.3 各 子 语料库 词汇 密度 对 比 


文 学 非 文学 
原创 汉语 翻译 汉语 原创 汉语 翻译 汉语 
实 词 61.40% 57. 30% 64. 50% 63. 10% 
代词 7.43% 10.11% 4.19% 5.32% 
虚词 13. 04% 15.67% 14. 56% 16. 65% 


”汉语 实 词 与 虚词 和 各 种 词类 的 划分 存在 不 同 的 划分 标准 和 类 型 。 如 ( 马 氏 文通 ) 把 汉 
语 分 为 实 词 和 虚词 两 大 类 ,“ 凡 字 有 事理 可 解 者 ,日 实 字 ;无 解 而 惟 以 助 实 字 之 情态 者 ,日 虚 
字 。" 虚 字 分 “ 介 字 、 连 字 、 助 字 、 吧 字 ” 四 类 。 黎 锦 辕 (新 著 国文 语法 ) 将 词 分 五 大 类 :实体 词 . 述 
说 词 .区 别 词 关 系 词 情 态 词 。 其 中 虚词 是 指 关 系 词 和 情态 词 。 王 力 (中 国 现代 语法 ) 认 为 词 
分 为 理解 成 分 和 语法 成 分 ,理解 成 分 即 实 词 包括 :名 词 . 数 词 . 形 容 词 .动词 ;语法 成 分 包括 半 
实 词 ( 副 词 ). 半 虚词 (代词 、. 系 词 ) 和 虚词 (联结 词 和 语气 词 )。 吕 叔 湘 和 朱德 让 (语法 修辞 讲 
话 ) 则 把 名 词 动词 和 形容 词 归 为 实 词 ,把 代词 .副词 .连词 语气 词 .象声词 等 归 为 虚词 。 可 见 ， 
争议 最 大 的 词类 是 副词 和 代词 ,究竟 这 两 类 词 属于 虚词 还 是 实 词 ,是 汉语 语言 学 家 争论 不 休 的 
问题 之 一 。 本 章 无 意 讨论 汉语 词类 划分 的 问题 ,但 由 于 在 研究 翻译 文本 与 非 翻 译文 本 差异 性 
时 ,不 可 避免 地 涉及 汉语 的 词类 问题 ,因此 本 章 综合 各 家 意见 ,主要 采取 了 王 力 . 昌 叔 湘 与 朱德 
四 先生 看 法 ,将 名 词 动词. 形容词 三 类 词 归 为 实 词 ;而 将 副词 .代词 .介词 连词 .助词 和 叹 词 等 
归 为 虚词 。 


第 2 部 分 语料库 与 翻译 研究 / 85 


(BR) 


非 文学 
原创 汉语 + 翻译 汉语 


原创 汉语 翻译 汉语 
17. 00% 15. 80% 


1.12% 1.06% 


K 10. 3 中 实 词 的 比例 即 本 章 所 说 的 词汇 密度 。 可 以 看 到 ,无 论 是 文学 语 料 还 
是 非 文学 语 料 在 词汇 密度 上 表现 趋 于 一 致 :翻译 汉语 的 词汇 密度 低 于 原创 汉语 , 即 
相同 长 度 的 翻译 汉语 语 料 中 使 用 的 实 词 少 于 原创 汉语 ,或 换言之 ,相同 长 度 的 翻译 
汉语 语 料 中 可 能 使 用 了 更 多 的 功能 词 ,词汇 密度 低 反 映 信息 量 和 文本 难 易 度 相对 
降低 。 因 此 ,词汇 密度 在 各 子 语料库 中 的 表现 支持 翻译 文本 的 “简略 化 "假设 一 一 
即 汉语 翻译 文本 具有 通过 降低 实 词 所 提供 的 信息 量 来 降低 译文 的 难度 ,从 而 提高 
其 可 接受 性 的 总 体 趋势 。 

10.2.2.2 虚词 显 化 

上 文 考察 了 实 词 的 比例 ,那么 虚词 在 翻译 汉语 中 表现 如 何 ? 从 表 10. 3 中 可 以 
看 到 ,汉语 文学 和 非 文 学 语 料 具 有 共同 趋势 翻译 汉语 的 虚词 比例 高 于 原创 汉语 。 
也 就 是 说 ,翻译 汉语 语 料 中 起 语法 功能 的 介词 .连词 助词 等 词类 使 用 频率 比 原创 
汉语 文本 高 ,我 们 把 这 种 现象 称 为 “虚词 显 化 ”( 或 语法 显 化 ) 。 由 于 汉语 总 体 而 言 
趋向 语法 标记 内 隐 ( 意 合 ) ,而 翻译 汉语 在 语法 标记 上 则 出 现 了 外 显 ( 形 合 ) 的 特征 ， 
我 们 认为 ,这 一 特征 支持 翻译 汉语 显 化 共性 的 假设 。 不 过 ,虚词 在 语料库 中 的 具体 
表现 如 何 ? 造成 翻译 汉语 虚词 显 化 的 原因 是 什么 呢 ? 为 了 回答 这 些 问题 ,我 们 对 
语料库 中 具体 词类 进行 了 更 深入 的 分 析 。 

图 10. 1 是 文学 语 料 中 原创 汉语 和 翻译 汉语 的 各 主要 词类 每 百 万 次 频率 比较 。 
从 中 可 以 更 直观 地 看 到 文学 语 料 中 :1) 原 创 汉 语 的 全 部 实 词 频率 均 高 于 翻译 汉语 ， 
其 中 以 名 词 频率 差异 较为 显著 。2) 原 创 汉语 的 全 部 虚词 频率 均 低 于 翻译 汉语 ,其 
中 助词 介词 ,连词 均 有 较 大 差异 。3) 原 创 汉语 的 代词 使 用 频率 明显 低 于 翻译 
汉语 。 

图 10. 2 是 非 文学 语 料 中 原创 汉语 和 翻译 汉语 的 主要 词类 频率 比较 。 从 该 图 
可 以 看 到 汉语 文学 语 料 与 非 文学 语 料 的 差异 :总 体 而 言 , 文 学 语 料 的 实 词 频率 更 低 
而 虚词 频率 更 高 ;文学 语 料 中 频次 最 高 的 词类 是 动词 ,而 非 文学 语 料 中 频次 最 高 的 
是 名 词 。 这 种 差异 可 以 从 文学 与 非 文学 语 料 的 不 同 功能 来 解释 :文学 作品 主要 供 
人 消 遗 娱乐 , 非 文学 作品 的 主要 功能 是 提供 信息 ,因而 文学 语 料 通过 降低 词汇 密 
度 ,增加 语法 明晰 度 来 提高 自身 的 可 读 性 。 除 此 以 外 , 非 文学 语 料 中 ,原创 与 翻译 
汉语 体现 出 与 文学 语 料 类 似 的 趋势 , 即 原创 汉语 的 实 词 频率 高 于 翻译 汉语 ,而 虚词 


15.23% 13.27% 
1.51% 1.62% 
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频率 低 于 翻译 汉语 。 但 从 虚词 频次 差异 程度 来 看 , 非 文学 翻译 语 料 不 如 文学 翻译 
语 料 明显 ( 见 图 10. 1 和 图 10. 2) 上 述 比较 说 明 虚 词 显 化 可 以 作为 文学 与 非 文学 翻 
译 汉 语 语 料 的 共同 特征 。 这 一 特征 使 我 们 对 汉语 翻译 文本 的 语言 特征 有 了 新 的 
认识 。 


EBERLE 
a 口 原创 汉语 文学 


量词 
sei 
形容 词 
副词 
zA 

hen 一 上 一 动词 
-100000 -50000 0 50000 100000 150000 200000 


图 10. 1 原创 汉语 和 翻译 汉语 文学 语 料 词类 频率 对 比 


we 翻译 汉语 非 文学 
ua 口 原 创 汉语 非 文学 


_, 动词 
-100000 -50000 0 


50000 100000 150000 200000 250600 
图 10. 2 原创 汉语 和 翻译 汉语 非 文 学 语 料 词类 频率 对 比 
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10.2.2.3 指 代 显 化 

如 上 所 述 ,本 章 把 代词 作为 “ 半 虚 词 " 单 列 讨论 ,这 是 由 于 代词 在 翻译 汉语 中 出 
现 了 与 原创 汉语 显著 不 同 的 特征 。 汉 语 代词 除 具 备 和 名 词 相同 的 指 别 (deixis) 的 
功能 外 ,还 具有 照应 (anaphora) 功 能 , 即 与 其 他 语言 单位 构成 同 指 关 系 的 功能 。 王 
力 (1989) 把 代词 归 人 “ 半 虚 词 ”, 就 是 指 代词 的 照应 功能 。 与 英语 及 其 他 印 欧 语言 
相 比 ,汉语 代词 的 类 型 较 少 ,使 用 频率 较 低 ( 刘 密 庆 1998: 445-476; HE PSE 1997: 
148-151) 。 汉 语 人 称 代 词 形式 上 没有 主格 宾 格 之 分 ,代词 所 有 格 与 英语 的 物 主 代 
词 相 比 使 用 得 更 少 。 汉 语 常 规 的 指 代 方式 主要 以 “名 词 复 现 ” 和 “ 零 代词 ”为 主 , 显 
性 人 称 代词 的 使 用 频率 一 般 较 低 。 上 述 特 征 可 以 说 是 原创 汉语 的 “常规 ”, 但 从 语 
料 库 代词 频率 统计 来 看 ,翻译 汉语 中 代词 显然 偏离 了 这 一 常规 。 从 图 10. 1 和 图 
10. 2 汉语 学 和 非 文 学 语 料 的 代词 频率 对 比 来 看 ,翻译 汉语 的 代词 频率 明显 高 于 原 
创 汉语 。 这 说 明 翻 译 汉语 倾向 于 将 指 代 关 系 显 化 。 


10.2.3 词 表 与 范 化 


词 表 (wordlist) 指 按照 类 符 的 频率 高 低 列 出 的 类 符 表 , 也 叫 词 频 表 。 我 们 用 
PowerGrep 工具 制作 了 四 个 子 语 料 库 的 词 表 ( 见 表 10. 4; 限 于 篇 幅 本 章 仅 列 前 十 
位 )。 该 词 表 列 出 所 有 类 符 的 频率 (frequency) 和 在 总 词 频数 中 所 占 的 百分比 。 初 
步 比较 之 下 ,各 子 语料库 的 词 表 开头 部 分 非常 相似 :除了 汉语 非 文学 原创 语料库 
外 ,其 他 三 个 语料库 词 表 的 前 30 位 都 是 以 “的 在 .和 了、 是 .一 ,为 有 、 不 、 我 ` 他 ” 
等 单字 词 构成 的 。 虽 然 各 子 语料库 的 具体 顺序 略 有 差别 ,但 基本 上 大 同 小 异 。 这 
些 单字 词 的 高 频 现象 是 汉语 词 表 的 普遍 现象 D。 各 子 语料库 前 30 位 的 高 频 词 几 
平 都 是 助词 ,介词 .连词 和 代词 等 起 语法 功能 和 修辞 作用 的 虚词 。 现 代 汉语 所 有 的 
结构 助词 “的 .地 ,得 ”和 动态 助词 “着 .了 、 过 ” 均 出 现在 前 30 位 中 ,其 中 结构 助词 
“的 "在 所 有 语料库 中 党 排 在 第 一 位 ,各 子 语料库 中 频率 最 高 的 动词 为 “是 ”, 介 词 为 
“在 ”, 数 词 为 "一 ”副词 为 “不 ”名词 为 “人 ”。 

表 10.4 各 子 语 料 库 词 表 前 十 位 
汉语 文学 原创 汉语 文学 翻译 汉语 非 文学 原创 | 汉语 非 文学 翻译 
频率 % 频率 | % 频率 | % 频率 % 
的 | 22041 | 4.78% | 的 | 38017 | 5.97%] 的 | 21425 | 6.71% |‖ 的 | 37999 | 7.73% 
了 | 12814 | 2.78% | 了 | 15476 | 2.43%] Æ | 5589 | 1.75%] 在 | 7964 | 1.62% 
不 | 8182} 1.77%] 他 | 15446 | 2.43%] 和 | 5306 [66% | æ 7852 | 1.60% 


D 汉语 非 文学 原创 语料库 选材 稍 显 单一 (以 政论 文 为 主 ) , 故 其 词 表 特征 表现 略 特殊 。 
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(BER) 
汉语 文学 原创 | 汉语 文学 翻译 | 汉语 非 文学 翻译 
频率 % 频率 | 频率 % 

是 | 7920 | 1.72% | 11859 | 5626 | 1.15% 
他 | 7666 | 1.66% 10459 5299 | 1.08% 
二 | 8322 1.37% | 在 | 10232 | 1.61% 5213 | 1.06% 
我 | 5052 |1.10%| 一 | 8699 3575 | 0.73% 
在 | 4710 | 1.02%] 不 | 7395 3096 | 0.63% 
— + 
着 | 4200 |0.91%| 你 | 6094 3007 | 0.61% 
你 | 4122 | 0.89%} 她 | 5713 0.61% 


翻译 汉语 语 料 与 其 他 原创 汉语 词 表 的 显著 区 别 在 于 :1) 汉 语文 学 翻译 词 表 前 30 
位 词语 的 频次 比例 之 和 为 32. 27% ,明显 高 于 其 他 汉语 语料库 (文学 原创 29. 99%, 
非 文学 原创 25. 33%% 和 非 文学 翻译 24. 35%)。 这 意味 着 汉语 文学 翻译 语 料 中 词 频 
最 高 的 30 个 词 重复 使 用 的 频率 更 高 。2) 文 学 翻译 词 表 前 十 位 中 ,出 现 了 四 个 人 称 
代词 (“他 ,我 .你 、 她 ”) ,而 文学 原创 中 只 有 三 个 (“他 ,我 .你 ”), 非 文学 原创 和 非 文 
学 翻译 各 仅 一 个 人 称 代词 。 这 说 明 ， SERS TEAC RTA 
他 所 有 语料库 ,这 为 “ 指 代 显 化 ”提供 了 另 一 证 据 。 

Laviosa(1998) 用 高 频 词 ( 即 最 常用 的 词语 ) 的 范围 来 考察 英语 翻 评级 事 文 的 
词语 使 用 的 模式 。 她 提出 并 验证 了 翻译 英语 中 高 频 词 所 占 比率 高 于 非 翻 译 英语 ， 
词 频 最 高 的 表 头 (list head) 占 更 高 的 比率 ,但 词 目 (lemma) 数 量 却 更 少 (1998: 6- 
8)。 汉 语 翻译 语 料 中 的 高 频 词 是否 也 有 同样 的 特点 呢 ? 我 们 分 析 了 各 词 表 中 不 同 
词 频段 的 高 频 词 数量 和 频率 。 

图 10. 3 显示 的 是 各 子 语料库 词 表 中 词 频 高 于 1%,0. 5%~1%,0. 4%~0. 5%， 
0.3% 一 0.4%,0.2%~0.3%,0.1%~0.2% 的 词语 数量 。 可 以 看 到 各 子 语料库 中 
词 频 高 于 0. 1% 的 高 频 词 数 量 分 布 。 汉 语文 学 语 料 和 非 文学 语 料 中 ,翻译 汉语 高 
频 词 数量 特征 是 一 致 的 一 一 翻译 汉语 中 高 频 词 (常用 词 ) 的 数量 少 于 原创 汉语 。 这 
表明 翻译 汉语 倾向 于 重复 使 用 较 少数 量 的 常用 词 。 这 一 特征 与 Laviosa(1998) 所 
说 的 “英语 翻译 小 说 词汇 模式 ”是 一 致 的 。 

另外 ,这 些 高 频 词 的 使 用 频率 与 各 子 语料库 总 词 频 的 比例 有 何 差异 ? 我 们 分 
别 统计 了 各 子 语料库 词 表 中 排名 前 10 位 、30 位 、50 位 和 100 位 的 类 符 在 总 词 频 中 
的 比例 (图 10. 4) 。 该 图 可 作 如 下 分 析 :1) 各 阶段 高 频 词 频率 汉语 文学 语 料 均 高 于 
非 文学 语 料 ,这 说 明文 学 文本 与 非 文 学 文本 相 比 ,常用 词 更 多 。2) 文 学 语 料 中 , 翻 
译 汉语 各 阶段 高 频 词 频率 均 高 于 原创 汉语 , 即 文学 翻译 文本 使 用 更 多 常用 词 。 
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3) 非 文学 语 料 中 ,翻译 汉语 各 阶段 高 频 词 频率 均 低 于 原创 汉语 , 即 非 文学 翻译 文本 
常用 词 更 少 ,但 差距 不 明显 。 


160} 
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120 F 


日 文学 原创 
图 文学 翻译 
国 非 文 学 原创 
m 非 文学 翻译 


1% tg 0.4%- 0.3%- 0.2%- 0.1%- sum 


0.5% 04% 0.3% 0.2% 


图 10.3 各 语料库 高 频 词 数量 比较 


回 文 学 原创 
图 文学 翻译 
国 非 文学 原创 
图 非 文学 翻译 


前 100 位 ， 前 50 位 Mot 前 10 位 
图 10.4 各 语料库 词 表 高 频 词 比 例 

上 述 分 析 说 明 : 文 学 翻译 语 料 中 使 用 的 常用 词汇 数量 更 少 ,而 使 用 频率 更 高 ， 
但 非 文学 翻译 语 料 似 未 呈现 同样 趋势 。 换 言 之 ,在 进行 英汉 文学 翻译 时 , 译 者 群体 
有 意 或 无 意 地 使 用 重复 使 用 了 较 少 数量 的 常用 词语 。 我 们 认为 这 一 特征 支持 翻译 
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汉语 简化 和 范 化 假设 一 一 常用 词 增加 ,文本 独特 性 减少 ,文本 难度 降低 ,可 接受 性 
提高 。 不 过 ,值得 注意 的 是 , 非 文学 翻译 语 料 只 是 部 分 支持 这 一 假设 。 如 前 所 述 ， 
这 可 能 是 受 语 料 选材 的 影响 ,希望 以 后 的 研究 能 更 多 关注 非 文学 翻译 的 特征 。 


10.3 小 结 


从 本 研究 来 看 ,我 们 可 以 对 翻译 汉语 的 词汇 特征 进行 如 下 概括 :汉语 文学 翻译 
语 料 与 文学 原创 汉语 相 比 ,表现 出 明显 的 简化 ` 显 化 和 范 化 特征 一 一 1) 类 符 形 符 比 
较 低 ,说 明文 学 翻译 的 词语 变化 度 较 低 ;2) 词 汇 密度 较 低 ,表明 文学 翻译 实 词 数量 
和 频率 较 低 , 故 实 词 数量 和 频率 所 反映 的 信息 量 大 小 和 文本 难度 也 就 相应 降低 ;3) 
文学 翻译 中 ,各 种 虚词 形 符 频率 和 代词 频率 均 高 于 原创 汉语 , 即 文学 翻译 出 现 了 虚 
词 和 代词 显 化 特征 ;4) 文 学 翻译 中 常用 词 数 量 更 少 而 频率 更 高 ,而 非 文学 翻译 语 料 
与 同类 原创 汉语 语 料 相 比 , 除 类 符 形 符 比 和 高 频 词 外 ,也 出 现 了 词汇 密度 降低 和 虚 
词 代 词 显 化 特征 。 因 此 ,我 们 至 少 可 以 把 实 词 简略 化 和 虚词 ,代词 显 化 作为 翻译 汉 
语 共同 的 词汇 特征 。 

上 述 研究 是 在 原创 汉语 与 翻译 汉语 所 构成 的 类 比 语 料 基础 上 进行 的 , 它 揭示 
的 是 同 为 汉语 的 翻译 文本 与 非 翻译 文本 的 差异 性 特征 。 这 一 点 是 本 章 和 基于 对 比 
语言 学 的 翻译 研究 的 区 别 。 以 语料库 为 基础 的 研究 为 描写 大 量 文本 的 共同 趋势 提 
供 了 很 大 便利 。 不 过 ,词汇 的 简化 与 显 化 特征 只 是 翻译 汉语 的 总 体 特征 ,并 不 意味 
着 所 有 汉语 翻译 文本 都 会 出 现 同样 的 简化 和 显 化 。 个 别 译 者 在 处 理 具体 译文 时 既 
可 能 遵从 也 可 能 违背 这 种 趋势 。 不 过 个 别 译作 的 倾向 不 会 改变 特定 时 期 汉语 文学 
翻译 语 料 的 总 体 特征 。 此 外 , 实 词 简化 也 不 能 简单 等 同 于 汉语 文学 翻译 语 料 阅读 
难度 更 低 , 原 因 是 异域 文本 对 译 和 人 语文 化 的 读者 往往 是 陌生 的 。 尽 管 译 者 通过 降 
低 实 词 密度 ,提高 语法 明晰 度 的 方法 来 增加 其 可 接受 性 ,但 限于 语 际 翻 译本 身 的 性 
质 ,这 种 陌生 感 总 会 存在 的 (例如 入 名 地 名 音译 ,物质 文化 和 事件 名 词 的 差异 等 ) 。 

翻译 的 特征 或 翻译 共性 对 于 探索 翻译 的 本 质 , 了解 语言 交往 时 的 相互 作用 和 
研究 译 入 语 在 表达 语言 文化 空缺 时 的 创造 力 具 有 重要 的 意义 。 而 以 语言 对 比 为 基 
础 的 传统 翻译 学 要 么 对 此 视而不见 ,要 么 把 偏离 译 和 人 语 规范 的 翻译 语言 特征 笼统 
地 贬斥 为 “翻译 腔 ”。 从 这 个 意义 上 说 ,基于 语料库 的 描写 翻译 学 做 出 了 具有 开创 
价值 的 贡献 。 当 然 ,我 们 也 应 该 看 到 ,尽管 语料库 翻译 研究 为 我 们 提供 了 对 大 量 真 
实 翻 译文 本 的 客观 描述 ,但 方法 本 身 并 不 提供 对 翻译 现象 的 解释 。 对 翻译 语言 的 
特征 或 翻译 共性 的 认识 需要 在 更 广泛 更 细致 的 描写 的 基础 上 不 断 地 加 深 。 


第 11 章 


汉 译 文学 作品 的 语法 显 化 


本 章 基 于 语料库 对 汉语 翻译 小 说 中 语法 标记 词 的 考察 发 现 :汉语 翻译 小 说 中 
各 类 语法 标记 词 的 使 用 频率 明显 高 于 非 翻译 小 说 ; 翻译 小 说 定语 标记 明显 增多 ， 
而 时 体 标记 减少 ;一 些 语法 标记 词 的 增 减 在 客观 上 起 到 了 口语 化 或 简化 的 效果 。 
“语法 标记 显 化 ”是 汉语 翻译 小 说 的 重要 特征 之 一 。 该 特征 一 方面 体现 了 翻译 小 说 
语法 的 明确 程度 提高 , 骨 在 加 强 译本 的 可 接受 性 ;而 另 一 方面 却 使 汉语 译文 在 一 定 
程度 上 偏离 了 现代 汉语 规范 ,呈现 出 句法 形式 的 陌生 化 或 异化 倾向 。 


11.1 翻译 共性 与 语 内 显 化 


翻译 文本 中 的 “ 显 化 ”(explicitation) 现 象 近年 来 在 国内 外 学 者 中 引起 了 较 广 
泛 的 注意 (Overas 1998;Olohan & Baker 2000; 柯 飞 2005; 胡 开 宝 , 朱 一 凡 2008; 黄 
立波 2008 等 )。 但 是 ,从 国内 外 学 者 对 显 化 概念 的 使 用 来 看 ,其 间 存在 较 大 理解 上 
的 分 歧 。 因 此 ,明确 厘定 “ 显 化 ?概念 是 研究 “翻译 共性 ”(translational universals) 
或 “翻译 特征 ”(features of translation) 的 前 提 之 一 。 

首先 ,我 们 知道 :翻译 共性 的 研究 背景 主要 是 由 埃及 裔 英国 学 者 Mona Baker 
所 创 的 语料库 翻译 研究 。 何 谓 “ 翻 译 共性 ”? Baker 曾 明确 定义 :“ 译 文 而 非 原文 中 
的 典型 的 语言 特征 ,这 些 特 征 与 翻译 过 程 涉及 的 特定 语言 对 无 关 ”(Baker, 1993; 
243) 。 她 的 学 生 Kenny 也 说 ;普遍 人 性 是 一 种 总 体 的 倾向 ,与 译 者 .语言 ,文体 和 时 
代 无 关 ”(2001: 52)。Olohan & Baker (2000), Kenny (2001), Laviosa (2002), 
Olohan(2004) 等 人 的 语料库 翻译 研究 都 是 围绕 着 这 一 概念 展开 的 , 即 通过 同一 语 
言 内 翻译 与 非 翻 译 (或 原生 /原创 ) 文 本 的 比较 ,寻找 翻译 文本 共同 的 特征 。 

第 二 ,何谓 “ 显 化 ”? 该 概念 由 法 国人 Vinay 和 Darbelnet 与 1958 年 提出 , 指 
“对 原 语 中 暗含 的 ,但 可 以 从 上 下 文中 推导 出 的 信息 在 译 语 中 加 以 明示 ”(1958:8)， 
与 之 相对 的 是 “ 隐 化 ”(implicitation)。 实 际 上 ,这 对 概念 最 初 是 作为 翻译 技巧 与 
“增补 ”和 “ 删 减 ” 相 提 并 论 的 ( 见 Klaudy 2004: 80-84)。20 世纪 80 年 代 , Blum- 
Kulka 系统 研究 了 显 化 现象 ,提出 了 著名 的 “ 显 化 假设 ”, 即 显 化 程度 提高 可 能 是 翻 
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译文 本 和 二 语 习 得 等 语言 中 介 活动 中 具 普 遍 性 的 策略 (1986: 19; 21)。Blum- 
Kulka 认为 显 化 是 翻译 本 身 固有 的 特征 ,与 译 者 对 原文 的 理解 过 程 有 关 , 而 与 特定 
的 语言 对 无 关 。 可 见 , 显 化 假设 与 作为 翻译 技巧 的 显 化 内 涵 不 同 。 这 里 的 显 化 才 
是 Baker 所 说 的 翻译 共性 之 一 。 

但 从 近期 的 一 些 论文 来 看 ,国内 同仁 对 显 化 的 理解 与 Blum-Kulka 和 Baker 
等 人 存在 着 差异 。 由 于 语言 形式 化 程度 、 文 体 、 译 者 和 文化 差异 等 因素 的 存在 ， 
翻译 的 具体 过 程 中 确实 普遍 存在 对 原文 语义 和 句法 形式 的 显 或 隐 ( 柯 飞 2005)。 
但 从 实例 来 看 ,翻译 中 的 “ 显 隐 ?与 翻译 技巧 “ 增 减 ” 似 无 本 质 区 别 , 都 是 根据 译 人 
语 的 语法 规范 增添 或 删 减 语义 内 容 或 语法 标记 , 且 显 隐 的 程度 随 各 种 因素 的 改变 
而 改变 。 这 显然 与 Baker 等 人 所 说 的 与 特定 语言 对 无 关 的 “翻译 共性 ”的 概念 不 
一 致 。 

黄 立 波 (2008) 注 意 到 了 国内 学 者 理解 的 显 化 与 Baker 等 人 的 区 别 , 因 而 提出 
了 *“ 语 际 显 化 ”和 “ 语 内 (类 比 ) 显 化 ”的 分 类 。“ 语 际 显 化 ” 指 译文 中 对 原文 隐 含 信息 
的 明示 ;“ 语 内 普 化 ” 则 是 翻译 文本 相对 同 为 译 语 的 非 翻 译文 本 的 显 化 程度 提高 。 
国内 学 者 对 显 化 的 研究 主要 是 对 “ 语 际 显 化 ”的 研究 , 即 英汉 互 译 过 程 中 的 显 化 (和 
Kft). 

要 厘清 “ 显 化 ”概念 的 所 指 , 消 除 研究 上 的 混淆 ,我 们 不 妨 从 比较 对 象 . 显 化 内 
容 、 强 制 性 和 影响 因素 四 个 层面 加 以 澄清 : 


表 11.1 “ 显 化 "概念 分 析 


比较 对 旬 显 化 内 容 强制 性 主要 影响 因素 
= eae ELBE FANE 译 者 社会 
_ 语 际 显 化 | 原 语文 本 / 译 语文 本 。 | 向 法 品 化 ”| 强制 性 / 非 强制 性 | 。 语言 关 民 
请 内 显 化 EEE/E | TT — 一 | me 


根据 比较 的 对 象 , 显 化 可 分 为 “ 语 际 显 化 "和 "* 语 内 显 化 "。 前 者 属于 对 比 语言 
学 范畴 ,而 后 者 指 同一 语言 内 翻译 与 非 翻译 文本 的 差异 。 从 内 容 上 讲 , 显 化 可 以 是 
对 原文 暗含 语义 的 明示 ,也 可 以 是 对 语言 形式 本 身 的 明示 ,也 即 “ 语 义 显 化 "和 ”名 
法 显 化 "。 语 义 显 化 受 译 者 文体 .读者 和 社会 因素 等 的 影响 ;语义 是 否 显 化 和 显 化 
的 程度 随 译 者 和 社会 需求 的 改变 而 改变 ,因而 它 是 非 强制 性 的 。 在 语 际 显 化 中 ,名 
法 显 化 取决 于 原 语 和 译 语 的 句法 形式 化 程度 的 差异 和 翻译 的 方向 。 它 可 以 是 强制 
性 的 (如 汉 译 英 ), 也 可 以 是 非 强制 性 的 (如 英 译 汉 )。 总 之 , 语 际 显 化 和 隐 化 本 质 上 
是 一 对 凸显 或 删 减 语义 和 语法 标记 的 翻译 方法 ,各 种 因素 制约 着 译文 显 隐 的 程度 ， 
它 与 翻译 共性 中 的 “ 显 化 ”不同 质 。 
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Baker 等 人 讨论 的 “ 显 化 ”实际 上 是 指 翻译 与 非 翻译 文本 之 间 显 化 程度 的 差 
异 , 即 “ 语 内 显 化 "。 在 语 内 显 化 中 ,由 于 翻译 和 非 翻译 文本 不 存在 内 容 上 的 关联 ， 
故 也 无 所 谓语 义 显 化 ;两 者 的 主要 区 别 体现 于 文本 特征 和 语言 形式 的 差异 ,也 就 是 
句法 显 化 。Baker 等 人 研究 的 目的 就 是 为 了 验证 “ 显 化 ,简化 和 规范 化 等 是 翻译 文 
本 的 普遍 特征 ”这 一 假设 。 这 些 普遍 特征 是 由 翻译 和 认 知 因素 决定 的 ,与 语言 . 文 
体 . 译 者 和 社会 文化 无 关 。 简 言 之 “ 显 化 "是 翻译 文本 的 本 质 特征 之 一 。 当 然 ,在 
对 各 种 语言 的 翻译 文本 进行 全 面 的 实证 研究 之 前 , 语 内 显 化 仅仅 是 一 种 有 待 验证 
的 假设 ,这 就 是 Blum-Kulka(1986) 提 出 的 “ 显 化 假设 ”。 

值得 指出 的 是 ,在 语料库 翻译 研究 中 , 显 化 是 一 个 总 体 性 概念 , 即 翻 译文 本 总 
体 与 非 翻 译文 本 总 体 相 比较 而 言 。 两 者 须 具 备 语料库 语言 学 上 的 代表 性 和 可 比 
性 。 这 个 概念 与 具体 翻译 过 程 中 的 语义 或 句法 显 化 ( 即 上 文 所 说 的 语 际 显 化 ) 有 根 
本 区 别 。 后 者 是 一 个 技术 性 ,个 别 性 和 非 强制 性 的 问题 ;而 前 者 是 一 种 普遍 趋势 。 
本 文 所 讨论 的 “语法 标记 显 化 ”就 是 指 汉语 翻译 文本 区 别 于 汉语 非 翻 译文 本 的 总 体 
特征 。 


11.2 语料库 与 翻译 小 说 的 “ 形 合 度 ” 


语料库 翻译 研究 的 主要 目标 是 用 语料库 语言 学 的 工具 和 方法 来 描写 真实 的 翻 
译 现象 ,以 探寻 翻译 自身 固有 的 语言 特征 ,或 寻找 翻译 的 普遍 性 质 ( 详 见 胡 显 炮 : 
2005 ,2008)。 这 种 方法 与 基于 对 比 语言 学 的 翻译 研究 的 区 别 在 于 ; 它 要 描写 的 是 
翻译 作为 一 种 语言 变 体 的 总 体 特征 ;而 后 者 以 实用 为 主要 目的 , 旨 在 发 现 和 分 析 语 
际 转换 的 方法 和 技巧 。 

语料库 翻译 研究 须 具 备 一 个 前 提 : 建 立 具 代表 性 的 翻译 语料库 和 与 之 有 可 比 
性 的 非 翻译 语料库 。 为 此 ,Baker 及 其 学 生 Laviosa 建立 了 第 一 个 只 收入 翻译 语 料 
《不 限 原 语种 类 ) 的 “翻译 英语 语料库 ?"(TEC)。 我 国 目前 已 有 的 语料库 翻译 研究 
中 , 绝 大 多 数 并 非 通过 可 比 语料库 (comparable corpus) 途 径 , 而 是 以 平行 语料库 
(parallel corpus) 为 主 。 为 了 研究 汉语 翻译 文本 的 总 体 特征 ,建立 能 够 代表 汉语 翻 
译文 本 的 可 比 语料库 势 在 必 行 。 

为 此 ,我 们 建立 了 一 个 翻译 语料库 一 一 当代 汉语 翻译 小 说 语料库 "(CCTFC ) 。 
该 语料库 收入 了 译 自 英 、 美 法 、 俄 . 德 .日 等 11 个 国家 八 种 语言 的 56 部 汉语 翻译 
小 说 。 语 料 1980 年 至 2000 年 间 出 版 的 长 篇 翻译 小 说 。 每 部 作品 以 取样 方式 收入 
20000 词 ,目前 容量 130 万 词 。 该 语料库 是 国内 第 一 个 现代 汉语 单 语 翻译 语料库 ， 
即 只 收入 翻译 小 说 语 料 ( 不 限 原 语种 类 )。CCTFC 进行 了 词 请 切 分 .词性 标注 、 句 
子 和 段落 等 多 层次 标注 。 本 章 将 围绕 CCTFC 以 及 作为 类 比 语料库 的 “ 兰 开 斯 特 
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现代 汉语 语料库 ”(LCMC) 的 小 说 子 库 LCMC(N) 展 开 。 

如 上 节 所 述 , 语 内 显 化 主要 表现 为 句法 显 化 。 各 种 语言 的 句法 形式 化 程度 是 
不 同 的 。 以 英 、 汉 语 为 例 ,形式 化 问题 在 我 国 一 般 被 称 为 “ 形 合 ”与 “ 意 合 ”"。“ 形 合 ” 
指 用 词语 ,形态 变化 ,语法 等 手段 来 连接 短语 和 句子 ;“ 意 合 ” 则 指 借助 语序 来 体现 
词句 之 间 的 意义 或 逻辑 关系 。 英 语 形式 化 (或 形 合 ) 程 度 较 高 :如 大 量 借助 语言 形 
态 变 化 ,频繁 使 用 关系 词 . 连 接 词 .介词 等 连接 词句 和 篇 章 等 。 而 汉语 形式 化 程度 
较 低 : 几 乎 没有 词 形变 化 ;缺少 与 英语 类 似 的 关系 词 ;连词 和 介词 都 不 活跃 。 不 
过 ,现代 汉语 也 大 量 采 用 助词 来 组 织 句 子 成 分 ,表达 时 、 体 , 态 和 语气 等 。 

由 于 缺乏 形态 变化 ,汉语 形式 化 主要 表现 为 虚词 或 语法 标记 词 (grammatical 
markers)@ 的 使 用 。 因 此 ,本 文 把 虚词 在 翻译 文本 中 的 比例 视 为 汉语 翻译 小 说 形式 
化 的 主要 指标 。 如 果 我 们 把 虚词 的 使 用 频率 在 总 词 频 中 所 占 的 比例 称 为 “ 形 合 度 ” 
Chypotactic level) ,那么 ,比较 “ 形 合 度 ”的 大 小 就 可 以 得 知 语料库 的 句法 显 化 程度 : 


表 11.2 各 语料库 的 形 合 度 比较 
CCTFC LCMC(N) 
词汇 密度 53. 48% 59. 13% 
形 合 度 39. 54% Bi 34. 25% 


LCMC PDC2000_1® 
63.33% | 68.63% 
29.64% | 22.92% 


中 ”由 英国 兰 开 斯 特大 学 语言 学 系 的 Tony McEnery 和 肖 忠 华 于 2003 年 建成 。LCMC 是 一 
个 严格 按 Freiburg-LOB 英国 英语 语料库 模式 建设 的 现代 汉语 书面 语 平衡 语料库 。LCMC 的 容 
量 为 100 万 词 ,包含 15 个 文体 类 型 ,收入 500 笨 字 数 约 2 000 词 的 样本 , 语 料 为 1989 到 1993 年 
中 国内 地 的 出 版 物 ,以 1991 年 语 料 为 主 。 其 中 包括 五 种 类 型 的 小 说 (McEnery and Xiao 2009), 

O 虽 受 欧洲 语言 影响 ,汉语 也 出 现 了 类 似 于 英语 的 “ 词 级 "和 复数 形式 ,但 数量 非常 有 限 ， 
形式 远 没 有 英语 那样 复杂 。 

O 汉语 实 词 与 虚词 和 各 种 词类 的 划分 存在 不 同 的 划分 标准 和 类 型 。 如 《 马 氏 文通 ) 把 汉 
语 分 为 实 词 和 虚词 两 大 类 ,“ 凡 字 有 事理 可 解 者 ,日 实 字 ;无 解 而 惟 以 助 实 字 之 情态 者 ,日 虚 字 。” 
虚 字 分 “ 介 字 、 连 字 、 助 字 、 叹 字 ” 四 类 。 柳 锦 黑 ( 新 著 国文 语法 ) 将 词 分 五 大 类 :实体 词 .述说 词 、 
区 别 词 .关系 词 . 情 态 词 。 其 中 虚词 是 指 关系 词 和 情态 词 。 王 力 (中 国 现代 语法 ) 认 为 词 分 为 理 
解 成 分 和 语法 成 分 ,理解 成 分 即 实 词 包 括 :名 词 . 数 词 . 形 容 词 .动词 ;语法 成 分 包括 半 实 词 ( 副 
词 )、 半 虚词 (代词 . 系 词 ) 和 虚词 (联结 词 和 语气 词 )。 且 叔 湘 和 朱德 康 ( 语 法 修辞 讲话 》 则 把 名 
词 动词 和 形容 词 归 为 实 词 ,把 代词 副词 .连词 .语气 词 . 象 声 词 等 归 为 虚词 。 可 见 ,争议 最 大 的 
词类 是 副词 和 代词 ,究竟 这 两 类 词 属于 虚词 还 是 实 词 ,是 汉语 语言 学 家 争论 不 休 的 问题 之 一 。 
本 章 无 意 讨论 汉语 词类 划分 的 问题 ,但 由 于 在 研究 翻译 文本 与 非 翻 译文 本 差异 性 时 ,不 可 避免 
地 涉及 汉语 的 词类 问题 ,因此 本 章 综合 各 家 意见 ,主要 采取 了 王 力 、 吕 叔 湘 与 朱德 黑 先 生 看 法 ， 
将 名 词 .动词 .形容 词 三 类 词 归 为 实 词 ; 而 将 副词 .代词 介词 .连词 .助词 和 叹 词 等 归 为 虚词 

加” 兰 开 斯 特大 学 开发 的 2000 年 (人 民 日 报 ) 语 料 库 , 本 章 所 用 为 2000 年 1 月 语 料 。 
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( 续 表 ) 
ceTrc | Lome | LCMC | PDC2000_1 


其 他 6.83% | 651% | 6.85% 8.33% 


表 11. 2 对 “ 形 合 度 ” 进 行 了 统计 。 为 能 更 直观 地 反映 各 语料库 的 面貌 ,我 们 还 
统计 了 各 语料库 的 词汇 密度 ( 即 实 词 频率 比例 ) ,并 引信 了 新 闻 语 料 (PDC2000_1) 
供 参考 。 表 11. 2 中 ,LCMC 是 一 个 包含 15 种 体裁 ,容量 为 百 万 词 的 现代 汉语 平衡 
语料库 。 它 在 一 定 程度 上 可 代表 现代 汉语 书面 语 的 总 体 特征 。 我 们 且 将 LCMC 
的 形 合 度 视 为 现代 汉语 的 “标准 形 合 度 ”。 从 上 表 可 见 , 小 说 文体 LCMC(N) 的 形 
合 度 高 于 标准 值 ,而 新 闻 语 料 的 形 合 度 低 于 标准 值 。 翻 译 小 说 的 形 合 度 为 各 语 料 
库 中 最 高 , 比 标准 值 高 出 近 10% , 比 非 翻 译 小 说 高 5% 。 这 意味 着 ,一 部 30 万 字 左 
右 中 等 长 度 的 翻译 小 说 要 比 同样 长 度 的 普通 汉语 著作 多 使 用 3 万 字 的 虚词 。 由 此 
可 见 , 翻 译 小 说 的 语法 标记 显 化 程度 高 于 汉语 非 翻 译 小 说 和 一 般 汉语 文体 。 

“ 形 合 度 ”从 总 量 上 体现 了 汉语 翻译 小 说 中 语法 标记 显 化 这 一 基本 特征 。 那 
么 ,语法 标记 显 化 是 如 何在 翻译 小 说 中 具体 实现 的 呢 ? 显 化 究竟 给 翻译 小 说 带 来 
了 怎样 的 实际 效果 ? 显 化 的 来 源 是 什么 一 一 是 语言 系统 差异 的 必然 结果 ,是 译 者 
在 某 种 隐藏 的 规范 指引 下 做 出 的 共同 选择 ,还 是 翻译 作为 一 种 特殊 的 认 知 活动 所 
必然 具备 的 共性 ? 以 下 分 别 从 助词 ,介词 和 连词 的 显 化 来 描述 翻译 小 说 语法 标记 
显 化 的 实际 表现 ,并 试图 寻求 合理 的 解释 。 


11.3 翻译 小 说 中 语法 标记 的 显 化 


11.3.1 助词 的 显 化 


我 们 统计 了 各 语料库 中 主要 的 六 个 助词 :结构 助词 “的 .地 、 得 ”和 动态 助词 
“着 .了 、 过 ”的 频率 。 从 图 11. 1 中 ,我 们 可 以 看 到 这 六 个 助词 的 绝对 频率 和 语料库 
之 间 的 相对 差异 : 

从 总 频率 来 看 ,汉语 小 说 助词 使 用 频率 高 于 总 体 ,翻译 小 说 高 于 非 翻 译 小 说 和 
汉语 总 体 。 结 构 助词 “的 ”的 绝对 值 和 相对 差异 最 显著 .“ 的 ”是 现代 汉语 中 词 频 最 
高 的 词 , 除 作 为 结构 助词 引导 定语 和 构成 “的 ” 字 短语 外 , 它 还 可 以 做 语气 助词 表示 
强调 。 翻 译 小 说 中 “的 ”的 频率 显著 高 于 非 翻 译 小 说 。 从 与 汉语 总 体 的 比较 来 看 ， 
汉语 原创 小 说 倾向 于 较 少 使 用 “的 ”, 而 翻译 小 说 却 正好 相反 。 这 说 明 翻 译 小 说 中 
限定 修饰 成 分 较 多 。 我 们 认为 ,在 “的 ”的 使 用 上 ,翻译 小 说 体现 出 很 强 “ 显 化 ”的 
趋势 。 
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CCTFC |50] 4, |3, | 6, | 11| 2, |78 


国 LCMC N)|41 | 4, | 2, | 6, | 14| 1, |71 


图 LCMC 50|3,|1,|3,|10|71|69 


图 11.1 各 语料库 主要 助词 频率 比较 
《每 百 万 词 ) 

结构 助词 “地 、 得 ”的 绝对 频率 较 低 , 且 翻译 与 非 翻译 小 说 之 间 相 差 不 大 。 翻 译 
和 非 翻译 小 说 的 动词 频率 无 明显 差别 ( 胡 显 炊 2008:160) ,与 动词 紧密 相关 的 状语 
和 补 语 也 没有 显著 差异 。 

动态 助词 “着 、 了 .过 ”中 ,“ 了 ”的 绝对 频率 是 最 高 的 ,这 是 由 于 在 汉语 中 了 ”的 
时 体 莉 盖 面 更 广 , 它 既 可 表达 行为 的 结束 也 可 表示 行为 持续 和 状态 持续 ,而 “着 ”只 
能 表示 动作 和 状态 的 持续 ,“ 过 ”只 能 表示 动作 的 完成 和 结束 。 从 图 11. 1 可 见 , 由 
于 小 说 以 叙事 、 对 话 和 描写 为 主 ,因而 表达 时 体 的 动态 助词 使 用 频率 高 于 汉语 总 
体 。 从 “着 .了 、 过 ”的 总 体 频率 来 看 ,翻译 (20 709) 反 而 低 于 非 翻 译 (22726) 。 换 言 
之 ,翻译 小 说 的 时 体 语法 标记 没有 非 翻 译 小 说 显著 。 另 外 ,值得 注意 的 是 , 非 翻 译 
小 说 中 * 了 ”的 频率 较 明显 高 于 翻译 小 说 。 由 于 翻译 小 说 的 原 语 主 要 是 英语 等 时 体 
特征 更 明确 (通过 形态 变化 等 ) 的 语言 ,而 汉语 的 时 体 特征 较为 模糊 ,三 个 助词 都 有 
不 同 程度 的 兼 类 现象 (如 上 面 的 "了 ”) 。 可 见 , 在 翻译 过 程 中 译 者 有 意 无 意 地 淡化 
了 原文 的 时 体 特征 ,使 译文 的 时 态 不 那么 清楚 。 这 是 翻译 文本 的 简化 特征 之 一 。 

综 上 所 述 , 在 助词 的 使 用 上 较为 清晰 的 两 个 趋势 是 :翻译 小 说 定语 标记 明显 增 
多 ,而 时 体 标记 减少 。 我 们 把 这 种 语法 标记 特征 分 别 叫做 翻译 的 “ 显 化 ”与 “简化 ”， 
其 目的 可 能 是 降低 翻译 小 说 的 难度 ,提高 可 接受 性 。 


11.3.2 介词 的 显 化 


汉语 介词 是 一 个 数量 有 限 的 封闭 型 词类 。 在 语义 层面 上 ,介词 的 主要 功能 是 
“引出 跟 动 词 所 指 动作 行为 或 形容 性 质 有 关 的 对 象 . 施 事 、 受 事 、 时 间 、 处 所 方向 、 
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方式 、 原 因 、 目 的 ,根据 和 范围 等 "( 周 小兵 1997)。 在 语法 层面 上 ,介词 通常 后 跟 词 
组 构成 介词 短语 主要 充当 状语 、 补 语 、 定 语 和 全 句 修 饰 语 等 句子 成 分 ( 获 玉 1997)。 
汉语 的 介词 主要 来 源 于 古代 汉语 介词 沿用 .动词 的 虚 化 和 外 来 语 的 影响 。 

贺 阳 (2004) 曾 通过 语 料 统计 指出 ,“ 关 于 、 对 、 对 于 和 在 N 的 V 下 ”等 为 “五 四 ” 
以 后 新 兴 的 介词 和 介词 结构 ;“ 在 、 当 ”两 个 介词 在 “五 四 ”以 来 使 用 频率 明显 升 高 ， 
介词 “ 当 ” 的 连词 化 等 。 如 果 说 通过 继承 古代 汉语 的 介词 和 动词 的 虚 化 是 汉语 自身 
的 发 展 规律 的 话 , 贺 阳 ( 同 上 ) 提 到 的 “现代 汉语 介词 中 的 欧 化 现象 " 则 是 汉语 与 外 
来 语 接触 的 结果 。 由 于 语言 系统 的 根本 差异 ,汉语 不 会 自动 “ 欧 化”, 而 是 需要 通过 
翻译 来 实现 。 因 此 ,我 们 认为 翻译 小 说 中 的 虚词 (包括 介词 ) 必 然 与 汉语 的 传统 语 
法 有 所 区 别 。 为 了 寻找 这 些 差异 性 特征 ,我 们 对 以 下 九 个 类 别 的 13 个 最 主要 的 介 
词 在 各 语料库 中 的 频率 进行 了 统计 和 比较 , 见 表 11. 3: 


表 11.3 各 语料库 主要 介词 词 频 比 较 (每 百 万 词 ) 


类 别 | ra | cerre LCMC(N) LCMC 
施 事 把 4013 | 2222 =, 1985 
受 事 被 1217 1489 1243 
=e Tf T 918 | 576 | 237 

与 446 960 1429 
工具 用 1115 746 | 984 
方法 以 590 448 1353 

12956 
on 
Su R E = E 
i aF no ao a 
范围 | 关于 115 77 255 
目的 为 (了 ) 1247 951 2206 
原因 因 ( 为 ) 1089 | 623 693 
合计 27097 19711 23 934 
上 表 可 分 析 如 下 : 


第 一 ,从 统计 的 所 有 介词 的 总 频率 来 看 ,翻译 小 说 的 介词 使 用 频率 明显 高 于 非 
翻译 小 说 ,并 高 于 汉语 总 体 , 而 汉语 原创 小 说 似乎 有 少 用 介词 的 倾向 。 

第 二 ,从 个 别 介词 的 绝对 频率 来 看 “在 "的 绝对 频率 在 现代 汉语 中 最 高 “对 ”、 
“为 (了 )”“ 与 ”分 别 次 之 。 
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第 三 ,翻译 小 说 中 处 所 介词 “在 "和 施 事 标记 介词 “把 ”的 频率 显著 高 于 汉语 小 
说 和 总 体 。 而 受 事 标记 介词 “被 "和 与 事 标记 介词 “与 ”的 词 频 却 低 于 非 翻译 小 说 。 
我 们 用 图 11. 2 来 比较 翻译 和 非 翻 译 小 说 介词 的 频率 。 需 要 说 明 的 是 ,以 下 柱状 图 
的 长 短 不 反映 各 介词 的 绝对 频率 ,而 只 是 两 个 语料库 之 间 的 相对 频率 比较 。 


E CCTFC E LCMC(N) 


0% 20% 4% 60% 60% 100% 
图 11. 2 ”翻译 和 非 翻 译 小 说 介词 频率 对 比 
从 图 11. 2 中 可 以 直观 地 看 到 ,翻译 和 非 翻 译 小 说 中 介词 使 用 的 差异 :翻译 小 
说 明显 更 频繁 地 使 用 介词 ,介词 总 频率 比 非 翻 译 小 说 高 近 20%% ,多 数 介词 的 频率 
都 高 于 非 翻 译 小 说 ,但 有 两 个 例外 :一 是 被 动 标记 “被 ”, 二 是 与 事 标记 “与 ", 且 后 者 
差距 十 分 明显 。 关 于 “被 ”, 我 们 将 另 文 讨论 。 这 里 只 考虑 “与 ”。 我 们 发 现 , 同 样 是 
与 事 标记 “ 跟 ” 的 频率 却 正好 和 “与 ”相反 , 它 明 显 高 于 非 翻译 小 说 中 的 频率 。 我 们 
研究 了 三 个 语料库 中 分 别提 取 的 索引 名 ,发现 这 种 现象 可 能 跟 * 与 与“ 跟 ” 的 性 质 
和 语法 功能 有 关 : 
首先 ,两 者 都 可 做 与 事 标记 介词 ,引入 行为 的 陪同 对 象 ,一 般 情况 下 可 以 互 
R. W: 


O 美国 副 总 统 到 拉美 修补 与 / 跟 拉 美国 家 的 关系 。(A 新 闻 报道 )Q 
(2) 此 人 的 相 艇 与 / 跟 模拟 像 特别 像 ， 作案 手法 又 相近 。(L 侦探 小 说 ) 


@ 例句 (1) 一 (6) 出 自 LCMC 语料库 ,例句 后 括号 中 为 语 料 类 别 。 
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其 次 ,两 者 的 区 别 在 于 “与 "更 多 用 于 比较 正式 的 ,书面 语 的 表达 (如 例 (3) 
(4)), 而 “ 跟 ” 更 常见 于 非 正式 的 .口语 的 表达 ( 例 (5)(6))。“ 与 ?更 多 地 用 作 连 词 
《连接 词语 和 短语 ) ,而 “ 跟 ” 基 本 上 只 用 作 介 词 。LCMC 中 “与 ”的 频率 高 于 “ 跟 ”, 很 
可 能 是 因为 LCMC 主要 是 书面 语 语料库 。 这 一 点 可 从 汉语 原创 小 说 中 “ 跟 ” 的 词 
频 高 于 “与 ?得 到 证 明 。 注 意 下 列 例句 : 


(3) 作为 三 十 年 代 的 女性 ,成 家 和 思想 感情 的 发 展 ,不 能 与 当时 的 潮流 脱 
开 。(P 爱情 小 说 ) 

(4) 高 渐 离 奏 雅 乐 而 行刺 的 行为 ,更 与 燕 国 太子 的 事业 无 关 。(G 传记 和 
杂文 ) 

《5) 这 样 吧 , 我 们 还 有 点 白 切 肉 ,这 便 跟 客 官 们 送 来 ,再 做 碗 菠菜 场 。(N 
武侠 小 说 ) 

(6) HERE, IRMAS EE., (N 武侠 小 说 ) 


翻译 小 说 中 “ 跟 ” 的 词 频 高 于 非 翻 译 小 说 ,体现 了 和 其 他 介词 同样 的 趋势 。 但 
“与 ?的 频率 却 低 于 非 翻 译 小 说 ,我 们 对 CCTFC 中 索引 名 的 分 析 显 示 ,“ 与 ?主要 用 
于 以 第 三 人 称 视 角 描述 事件 (如 (7) (8)(9)), 而 “ 跟 ” 主 要 出 现在 人 物 的 对 话 和 自白 
式 的 投 述 中 (如 (12)(13)(14))。 同 时 ,“ 与 "和 “ 跟 ” 的 混用 增多 (如 (10) (15))。 由 
于 翻译 小 说 “ 跟 ” 的 频率 是 “与 ”的 两 倍 ,而 原创 小 说 正好 相反 ,所 以 可 以 理解 为 翻译 
小 说 中 按照 汉语 小 说 的 习惯 可 以 用 “与 ”的 地 方 更 多 地 使 用 了 “ 跟 ”。 


(7) 如 今 她 出 门 到 黑夜 中 去 了 ,可 他 仍然 与 她 同 在 。(《 儿 子 与 情人 四 

(8) 她 仍 与 大 学 生来 往 ,尤其 与 读物 理化 学 的 俄国 青年 交 好 。(《 父 与 
F7» 

(9) RSK Z FEE RAD AIR. (CE) 

(10) 她 只 与 他 谈 过 一 两 句 话 ,而 且 当时 他 的 身份 是 学 校 督察 员 。(《 恋 爱 
中 的 女人 》) 

AD 珍妮 呢 , 无 论 雷 斯 脱 有 病 无 病 。 当然 乐意 他 跟 自己 一 起 的 。(《 珍 妮 
姑娘 

AD 你 再 不 要 那样 跟 我 说 话 了 ,好 吗 ? 《海明威 短篇 小 说 选 》) 

(13) 我 实在 没 办 法 ,我 是 天 生 喜 欢 跟 女 人 在 一 起 。(《 马 丁 伊 登 )) 


O HA~ H É CCTFC 语料库 ,为 节省 篇 幅 , 例句 后 只 列 出 语 料 所 出 自作 品 的 标 
题 。 作 者 、 译 者 和 出 版 信息 参见 胡 显 净 (2008:239-242) 。 
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AD 那个 肌肉 发 达 的 男人 站 起 来 , 跟 她 握 了 握手 。C《 本 性 》) 
(15)“ 警 察 "臂章 是 信任 他 们 可 以 跟 德 国 宪兵 来 往 的 标志 。(《 青 年 近 卫 
D 


由 此 可 见 ,“ 与 ”的 减少 和 *“ 跟 ”的 增多 在 客观 上 起 到 了 一 种 口语 化 和 简化 的 效 
果 。 我 们 认为 ,这 种 做 法 很 可 能 是 一 种 降低 文本 的 难度 ,提高 翻译 文本 可 接受 性 的 
做 法 一 一 通俗 地 说 ,就 是 使 译本 显得 更 亲近 一 些 。 这 是 一 种 为 使 译 语 读者 接受 译 
本 的 考虑 所 做 出 的 简化 翻译 策略 。 而 介词 的 总 体 频率 更 高 ,也 符合 翻译 小 说 的 形 
合 程度 高 于 非 翻译 小 说 和 汉语 总 趋势 ,这 是 语法 标记 显 化 的 体现 。 


11.3.3 连词 的 显 化 


连词 是 一 种 具有 多 层 连 接 功 能 的 虚词 , 既 可 以 连接 词 和 短语 ,也 可 以 连接 小 句 
和 和 句子 ,还 可 以 连接 句子 和 句 组 ( 张 研 , 张 这 生 2000:140-195)。 汉 语 连 词 可 以 按 各 
种 标准 进行 分 类 ,但 比较 通行 的 方法 是 , 按 意义 将 连词 分 为 联合 连词 和 偏 正 连词 两 
大 类 ,联合 连词 下 又 分 并 列 、 连 贯 、 递 进 、 选 择 关系 的 连词 等 小 类 ; 偏 正 连 词 又 分 因 
果 , 转 折 、 条 件 \ 假 设 . 让 步 、 目 的 关系 的 连词 等 小 类 (同上 :140-145)。 按 连接 的 语 
言 形式 ,连词 可 分 为 连接 词语 和 短语 和 连接 分 句 和 句子 的 连词 ;连接 分 句 和 句子 的 
又 分 只 能 连接 分 句 和 既 可 以 连接 分 句 又 可 以 连接 句子 ,还 可 以 连接 段落 的 两 小 类 
(上 虽 概 湘 1999)。 由 于 连词 的 类 型 和 数量 较 多 ,本 文 仅 考察 以 下 十 类 连词 中 最 主要 
的 连词 在 翻译 和 非 翻译 语料库 中 的 表现 ( 见 表 11. 4)。 


表 11.4 各 语料库 主要 连词 频率 比较 (每 百 万 词 ) 


类 别 No. 连 词 CCTFC | LCMC(N) LCMC 
| 112 102 152 

并 列 2 下 123 107 58 
3 68 38 27 

a 12 43 | 46 

连贯 5 接着 365 | 192 95 
6 然后 513 431 291 

7 不 但 39 81 33 

递 进 8 而 且 666 303 394 
9 不 仅 105 nm | 2 

10 | 27 4 4 

选择 ul 322 264 | 143 
12 22 | 9 8 
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(eR) 
类 别 No, 连 词 CCTFC LCMC(N) LCMC 
13 1466 555 | 571 
因果 14 =: 271 171 于 461 
15 539 380 | 354 
16 460 533 | 382 
17 2433 | 1877 1788 
转折 18 895 525 | 220 
19 297 256 217 
20 HEN 457 358 360 
. 21 RE 297 213 | 195 
条 件 22 + 除非 “| 50 38 | 16 
23 RE 208 J 149 | 87 
24 无 论 138 94 89 
y 25 如 果 725 380 600 
26 假如 | 55 | 47 38 
让 步 | 27 即使 165 | 85 95 
28 以 便 33 13 45 _ 
ab 29 ae | 8 9 | 8 


表 11.4 可 分 析 如 下 : 

第 一 ,主要 连词 的 总 频率 :小 说 文体 中 连词 频率 略 高 于 汉语 总 体 ,但 总 体 来 说 ， 
汉语 小 说 和 非 小 说 连词 使 用 的 频率 差别 不 大 ,而 翻译 小 说 连词 的 频率 显著 高 于 非 
翻译 小 说 和 汉语 总 体 。 

第 二 ,主要 连词 的 绝对 频率 :各 语料库 连词 频率 总 体 趋势 大 致 相同 一 一 绝对 频 
率 最 高 的 联合 连词 是 :而 且 、 然 后 .是 …… 还 是 ;绝对 频率 最 高 的 偏 正 连词 是 :但 /但 
是 因为. 如果。 联合 连词 的 词 频 总 数 低 于 偏 正 连词 ,这 可 能 是 因为 汉语 并 列 、 承 
接 、 递 进 和 选择 关系 的 复句 倾向 于 不 使 用 连词 ( 见 图 11. 3 和 图 11. 4) 。 

第 三 ,主要 连词 的 相对 频率 :翻译 小 说 中 绝 大 多 数 的 连词 频率 都 高 于 非 翻 译 汉 
语 , 例 外 只 有 :首先 不但, 不仅. 以 便 、 以 免 "等 五 个 连词 。 翻 译 小 说 的 频率 明显 高 
于 非 翻 译 小 说 的 连词 是 :“ 因 为 ,但 (是 )、 接 着 和 而 且 ”, 这 几 个 连词 同时 又 是 各 语 料 
库 中 高 频 连词 。 由 于 “不 但 ,不仅 ”两 个 连词 通常 与 “而 且 ” 合 用 , 故 可 以 认为 翻译 小 
说 中 单 用 “而 且 " 更 为 频繁 。 汉 语 小 说 和 汉语 总 体 在 连词 使 用 上 看 不 出 明显 差异 : 
一 般 来 说 ,小 说 中 的 连词 频率 高 于 总 体 ,但 在 递 进 关系 连词 “不 但 ,不仅 ,而且 ” 三 词 
的 表现 上 ,小 说 的 频率 低 于 总 体 。 
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图 11. 3 各 语料库 联合 关系 连词 频率 比较 
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图 11.4 各 语料库 偏 正 关系 连词 频率 比较 


11.4 小 结 


通过 上 述 分 析 ,我们 认为 “语法 标记 显 化 ?是 翻译 小 说 区 别 于 非 翻 译 小 说 和 其 
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他 汉语 原创 文本 的 显著 特征 之 一 。 主 要 的 语法 标记 词 :助词 ,介词 和 连词 的 使 用 特 
征 都 分 别 证 实 了 这 一 趋势 。 同 时 ,我 们 还 发 现 ,翻译 小 说 定语 和 语气 标记 词 (“的 ”) 
明显 增多 ,而 时 体 标记 词 (“着 ”了 ”“ 过 ”) 减 少 。 此 外 ,介词 “与 ”的 减少 和 “ 跟 ” 的 
增多 在 客观 上 起 到 了 一 种 口语 化 或 简化 的 效果 。 翻 译 小 说 中 的 连词 在 总 体 频率 上 
明显 高 于 非 翻译 小 说 ,其 中 因果 ,转折 、 承 接 和 递 进 关系 连词 增加 较 显著 。 

翻译 小 说 语法 标记 显 化 的 原因 固然 可 以 解释 为 是 源 语 ( 尤 其 是 高 形式 化 的 源 
语 ) 的 影响 所 致 , 即 翻译 汉语 中 普遍 存在 对 高 形式 化 源 语 的“ 仿 译 ”。 但 正如 第 11. 1 
节 所 言 , 外 译 汉 过 程 中 句法 显 化 是 非 强制 性 的 ,为 什么 现代 汉语 翻译 小 说 的 译 者 总 
体 上 选择 了 “ 显 化 ” 呢 ? 译 者 如 何在 原 语 和 译 语 两 种 截然 不 同 语言 规范 中 做 出 选择 
是 语言 系统 差异 无 法 解释 的 。 

因此 , 另 一 种 解释 是 :“ 显 化 ”是 译 者 在 社会 因素 控制 下 所 做 出 的 选择 ,或 者 说 ， 
语法 标记 显 化 是 “翻译 规范 ”控制 译文 生产 的 结果 。 形 合 的 客观 结果 是 使 译文 趋向 
于 更 贴近 原文 而 偏离 译 语 。 对 译 语文 化 来 说 就 是 趋向 于 翻译 文本 的 陌生 化 ,希望 
翻译 能 向 译 语文 化 提供 “ 异 质 ”的 新 材料 以 丰富 和 更 新 译 语文 化 系统 并 促进 其 发 
展 。 当 然 ,如 果 某 一 时 期 译 语 社会 对 翻译 文本 的 期 待 倾向 于 “ 隐 化 ”, 那 么 这 一 时 期 
的 翻译 文本 就 应 该 出 现 语法 标记 隐 化 的 总 体 特 征 。 不 过 ,这 一 假设 需要 对 大 量 翻 
译文 本 的 历时 性 考察 才能 得 以 证 实 。 

我 们 还 可 以 从 翻译 行为 的 认 知 特性 出 发 ,做 出 第 三 种 解释 :语法 标记 显 化 可 能 
是 汉语 翻译 文本 的 普遍 特征 或 “翻译 共性 ”之 一 。 翻 译 的 理解 认 知 过 程 ,翻译 所 隐 
含 的 解释 性 ,以 及 提高 译文 可 接受 性 这 一 基本 倾向 都 可 能 造成 译 者 提高 译文 形式 
上 明确 程度 ,减少 歧义 ,简化 语义 等 等 。 第 三 种 解释 更 贴近 于 “ 显 化 ”作为 翻译 共性 
这 一 假设 ,不 过 , 目前 语料库 翻译 研究 的 局 限 性 在 于 一 一 它 可 以 提供 实证 的 证 据说 
明 翻 译文 本 的 总 体 趋势 ,但 它 本 身 却 无 法 对 这 些 趋势 加 以 解释 。 因 此 ,本 文 所 描述 
的 显 化 现象 还 有 待 翻译 学 界 更 多 的 解释 性 研究 。 


第 12 章 


英 译 汉文 本 中 和 人称 代 词 的 显 化 特征 


本 章 借助 双语 平行 语料库 对 英汉 翻译 中 人 称 代词 主语 在 文学 和 非 文学 两 种 文 
体 类 型 中 数 基 ,频次 和 转换 类 型 三 方面 考察 发 现 :文学 与 非 文 学 英 译 汉 时 ,人 称 代 
词 主语 数量 和 频次 均 呈 减少 趋势 ;从 转换 类 型 看 ,人 称 代词 主语 转换 以 对 应 关系 为 
主 , 语 际 显 化 和 隐 化 均 不 明显 :相对 非 翻 译 汉语 文本 ,汉语 翻译 文本 类 比 显 化 突出 。 
研究 表明 : 英 译 汉 过 程 中 ,人 称 代词 主语 语 际 转换 表现 出 源 语 迁 移 现象 ; 语 内 类 比 
显 化 突出 ,根本 原因 在 于 英 、 汉 语 对 形式 手段 依赖 程度 的 差异 ,以 及 语言 相对 社会 
地 位 和 认 知 规律 等 因素 的 作用 。 


12.1 引言 


语料库 翻译 研究 (corpus-based translation studies) 途 径 经 过 十 多 年 的 理论 阐 
述 与 实证 研究 已 经 发 展 成 为 一 种 新 研究 范式 ,研究 内 容 涉及 翻译 语言 共性 特征 、 译 
者 文体 、 翻 译 转换 过 程 等 ,其 中 以 对 翻译 共性 (translation universals) 的 研究 最 为 突 
出 ,翻译 共性 中 又 以 对 显 化 (explicitation) 的 讨论 较为 集中 。 由 于 英 、 汉 两 种 语言 
对 人 称 代 闻 手段 在 构 句 层面 的 依赖 程度 不 同 ,英汉 翻译 中 人 称 代词 的 转换 表现 出 
一 定 的 特点 。 限 于 篇 幅 , 本 章 借助 汉 英 平行 语料库 , 仅 考察 人 称 代 词 主语 ( 且 仅 限 
于 人 称 代词 主格 形式 ,不 包括 物 称 代词 反 身 代词 和 领 属 代词 ) 在 英汉 翻译 中 的 转换 ， 
以 此 入 手 探究 英汉 翻译 中 的 显 化 现象 ,并 尝试 从 语言 形式 手段 差异 的 角度 加 以 解释 。 


12.2 英汉 翻译 中 的 人 称 代词 


Quirk et al(1985:347) 指 出 ,英语 第 一 、 二 人 称 代词 有 具体 所 指 时 通常 用 来 直 
接 指称 会 话 场景 中 的 说 话 者 和 称谓 对 象 ,第 三 人 称 代词 则 用 于 指称 能 根据 语言 外 
因素 推断 出 的 人 或 事物 ,更 多 的 是 用 于 预 指 或 回 指 。 吕 叔 湘 (1999:8) 指 出 “汉语 
里 可 以 不 用 人 称 代词 的 时 候 就 不 用 ;即使 因此 而 显得 句子 结构 不 完整 ,也 不 搞 形 式 
主义 "。 可 见 ,人 称 代词 “ 隐 去 ”(implicating) 是 汉语 的 一 个 特点 。 相 比较 而 言 , 英 
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语 对 人 称 代词 的 依赖 程度 要 高 于 汉语 。 已 有 文献 对 此 做 过 探讨 ,我 们 又 从 语料库 
数据 分 析 进 一 步 加 以 论证 。 

赵 世 开 (1996,1999) 对 英汉 和 汉 英 翻译 中 人 称 代词 使 用 频次 考察 发 现 :无 论 英 
译 汉 还 是 汉 译 英 ,1) 英 语 第 三 人 称 代词 比 汉语 用 得 多 ;2) 英 语 第 一 人 称 单 数 代词 比 
汉语 的 使 用 率 低 ;3) 第 二 人 称 代词 的 使 用 汉语 比 英语 多 , 据 此 他 以 说 话 人 (S) 和 听 
话 人 (H) 为 语 用 参数 将 英语 和 汉语 区 分 为 X 型 和 YY 型 O。 根 据 赵 世 开 (1999) 的 统 
计 : 就 人 称 代词 数量 看 ,从 英语 原文 到 汉语 译文 ,第 一 人 称 代词 减 少 ,第 二 人 称 代词 
增加 ,第 三 人 称 代词 减少 最 突出 ;从 汉语 原文 到 英语 译文 ,第 一 人 称 代词 增加 ,第 二 
人 称 代词 增加 不 十 分 明显 ,第 三 人 称 代词 增加 最 突出 ;从 人 称 代词 所 占 比例 上 看 ， 
从 英语 原文 到 汉语 译文 第 一 人 称 代词 比例 增加 不 明显 ,第 二 人 称 代词 比例 明显 增 
加 ,第 三 人 称 代词 减少 ;从 汉语 原文 到 英语 译文 ,第 一 人 称 比例 减少 不 明显 ,第 二 人 
称 减 少 ,第 三 人 称 增加 突出 。 这 一 研究 将 汉 英 对 比 研究 与 翻译 研究 相 结 合 ,具有 开 
创 性 ,为 后 来 就 英汉 、 汉 英 翻 译 中 人 称 代词 转换 类 型 研究 ,以 及 对 人 称 代 词 增加 或 
减少 在 译文 中 的 作用 研究 葛 定 了 基础 。 

根据 刘 礼 进 (1997) 对 一 部 英语 小 说 及 其 汉 译 本 第 一 章 中 第 三 人 称 代词 频次 的 统 
计 , 汉 语 译文 中 的 第 三 人 称 代词 频次 低 于 英语 原文 , 刘 礼 进 指出 英语 回 指 式 人 称 代词 
的 频次 高 于 汉语 ,但 汉语 译文 中 回 指 式 人 称 代词 的 频次 也 很 高 。 这 一 研究 未 对 翻 
译文 本 (translated text) 和 译 语 非 翻译 文本 (TL non-translated text) 中 第 三 人 称 回 
指 的 情况 加 以 对 比分 析 , 因 此 还 不 能 确认 英语 回 指 式 人 称 代 词 的 频次 高 于 汉语 。 

赵 宏 、 邵 志 洪 (2002) 选 择 汉 、 英 各 两 个 小 说 文本 及 其 译本 各 约 一 千 字 , 对 其 中 
第 三 人 称 前 指 照应 进行 统计 发 现 ,英语 语 篇 中 第 三 人 称 代词 的 使 用 频率 高 于 汉语 ， 
而 且 这 一 倾向 在 汉 译 英文 本 中 表现 更 为 突出 : 汉 译 英文 本 中 人 称 代词 的 添加 十 分 
突出 , 英 译 汉文 本 中 的 省 略 不 大 明显 , 相 比 而 言 ,保留 原文 中 人 称 代词 的 做 法 反而 
十 分 明显 。 

王 琼 琼 , 王 克 非 (2004) 从 第 三 人 称 代 词 作为 照应 手段 的 视角 出 发 ,发 现 学 生 英 
汉 翻 译 习作 中 会 出 现 汉语 第 三 人 称 代 词 的 宛 余 现象 ,但 学 生 以 汉语 母语 写作 却 不 
会 出 现 第 三 人 称 代词 的 宛 余 现象 ; 汉 英 翻译 中 ,英语 译文 中 对 第 三 人 称 代 词 的 使 用 
也 大 大 高 于 汉语 原作 中 单数 第 三 人 称 代词 的 频次 , 即 发 生 了 人 称 代 词 的 添加 现象 。 

以 上 研究 对 英汉 或 汉 英 翻译 过 程 中 人 称 代词 使 用 进行 了 关注 ,但 尚未 对 人 称 
代词 在 翻译 中 的 转换 类 型 与 同类 非 翻译 文本 中 的 情况 加 以 对 比 , 未 就 人 称 代词 在 


D 第 三 人 称 出 现 比例 高 的 是 X 型 ,第 一 .二人称 出 现 比例 高 的 是 了 型 ;说 话 人 单数 人 称 代 
词 使 用 频次 低 ,复数 使 用 频次 高 的 为 X 型。 相反 ,单数 人 称 代词 使 用 频次 高 ,复数 使 用 频次 低 的 
为 X 型 ( 赵 世 开 1999:20). 
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翻译 转换 过 程 中 的 对 应 (correspondence) 明示 (explicating)、 添 加 (adding) 或 隐 去 
(implicating) 等 进行 深入 探讨 ,而 且 用 于 考察 人 称 代词 使 用 的 语 料 大 都 限于 文学 
文本 ,并 且 以 人 工 统计 为 主 的 语 料 规模 较 小 。 我 们 在 前 人 研究 的 基础 上 ,从 人 称 代 
词 主语 在 英汉 翻译 中 的 表现 为 考察 对 象 ,以 “ 汉 英 对 应 语料库 ”提供 的 英语 原文 及 其 
对 应 汉语 译文 为 基础 ,并 且 以 汉语 非 翻 译文 本 作为 类 比 语 料 ,探索 英汉 翻 中 的 显 化 。 


12.3 英汉 翻译 中 人 称 代词 主语 转换 的 语料库 考察 


12.3.1 翻译 中 的 显 化 


作为 翻译 共性 的 一 个 方面 ,本 章 对 显 化 现象 的 探讨 主要 集中 在 两 个 方面 :第 
一 ,是 指 翻译 过 程 中 ,在 译文 中 添加 或 明示 原文 中 隐 含 (implicit) 语 言 成 分 的 过 程 ， 
目的 在 于 更 清楚 地 传达 原文 中 的 语法 和 非 语法 信息 ,相反 的 过 程 则 被 称 为 隐 化 
Cimplicitation) , 即 根据 译 语 语言 规范 隐 去 原文 中 语言 成 分 的 过 程 。 另 一 类 显 化 是 
指 翻译 文本 相对 于 译 语 中 非 翻译 文本 所 表现 出 的 显 性 程度 (explicitness) 提 高 。 本 
章 将 前 一 种 显 化 视 为 语 际 对 比 基 础 上 的 显 化 ,简称 语 际 显 化 (inter-language 
explicitation) ;而 将 仿 译 式 的 显 化 视 为 翻译 语言 相对 译 语 中 非 翻 译 语言 所 表现 出 
的 语 内 类 比 显 化 ,简称 类 比 显 化 (comparable explicitation) ,此 两 者 都 应 作为 显 化 
研究 的 对 象 。Chesterman(2004a,2004b) 将 其 分 别 归 入 源 语 型 共性 (S-universals) 
和 目标 语 型 共性 (T-universals) 中 ( 吴 昂 、 黄 立波 2006; 黄 立波 、 王 克 非 2006 等 )。 
同时 需要 指出 的 是 ,翻译 转换 中 的 显 与 隐 通 常 相伴 而 存 @, 本 章 将 语 际 隐 化 也 作为 
关注 的 一 个 方面 ,限于 篇 幅 , 类 比 研究 中 主要 以 对 类 比 显 化 的 探讨 为 主 。 


12.3.2 人 称 代词 主语 在 翻译 中 的 转换 类 型 
英汉 翻译 中 ,人 称 代词 主 语 的 转换 类 型 可 分 为 对 应 、 明 示 、 添 加 和 隐 去 四 种 , 具 
体 如 下 @: 


第 一 ,对 应 即 原文 中 的 人 称 代词 主语 在 译文 中 同样 以 人 称 代词 主语 将 其 译 
出 。 如 : 


(1) Using these sources as my guide, I retraced what I believe was the 
path he took from Bellingham to Madison County in August of 1965. Driving 


O 语 际 显 化 与 语 际 隐 化 两 者 并 不 存在 对 称 关系 (Klaudy & Károly 2005), 
@” 源 语 与 译 语 例句 中 的 人 称 代词 主语 均 以 黑体 标 出 。 
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toward Madison County at the end of my travels, I felt I had, in many ways, 
become Robert Kincaid. 

以 这 些 材料 为 线索 ,我 沿 着 我 认为 是 金凯 1965 年 8 AAD a Bae i Hh 
的 路 线 作 了 一 次 旅行 ,在 行程 终了 时 ,我 觉得 自己 在 很 多 方面 变 成 了 罗伯特 。 
金凯 。(Robert James Waller, The Bridge of Madison County , 梅 嘉 译 ) 

(2) To spare himself, he agreed to disarm of all weapons of mass 
destruction. 

为 了 保全 自己 ,他 同意 解除 全 部 大 规模 毁灭 性 武器 。(George W. Bush, 
State of the Union Message) 


第 二 ,明示 是 指 将 原文 中 的 逻辑 主语 在 译文 中 以 人 称 代词 主语 的 形式 译 出 。 如 ， 


(3) Edward found it something of an effort to comply, for his mind kept 
wandering—trying to remember what the service was that he had done Goodson, 

听 着 麦子 的 话 ,爱德华 有 点 儿 跟 不 上 ,因为 他 总 是 心 狼 意 马 一 一 他 在 使 劲 
想到 底 给 古 德 森 帮 过 什么 忙 。(Mark Twain The Man that Corrupted 
Hadleyburg , 常 健 译 ) 

(4) The claimant Robison was a conscientious objector who had 
performed alternative service, as required by the draft law. 

申请 人 重 宾 逊 是 个 因 道德 或 宗教 原因 而 拒 服 兵役 者 ,他 提供 了 《征兵 法 ) 所 
要 求 的 其 他 可 替代 的 服务 。(R. W. Findley & D. A. Farber, Environmental 
Law in a Nutshell) 


第 三 ,添加 即 原文 中 没有 出 现 主语 ,但 在 译文 中 却 根据 上 下 文 添加 了 人 称 代词 
作为 主语 。 如 : 


(5) “It was wicked, that is what it was—just blasphemous presumption, 
and no more becoming to a meek and humble professor of 一 ” 

“SOCOM RATT MS , BRALIX Z [El 48 $A FD ARR A EMD 
5 A thi——” (Mark Twain, The Man that Corrupted Hadleyburg , 常 健 译 ) 

(6) The agency also adopted a summary judgment procedure, under 
which a manufacturer facing disapproval of a drug would be denied a hearing 
unless it could demonstrate in advance that it could present a “genuine and 
substantial issue of fact” under the new rules, 
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该 机 关 还 采取 了 即 决 审判 程序 , 依 此 程序 , 面 对 产 品 遭 否决 的 制造 商 将 被 剥 
夺 听 证 机 会 ,除非 他 事前 可 以 证 明 , 根 据 新 的 规则 ,他 可 提出 “真正 和 实质 的 事实 
m”. (R. W. Findley & D. A. Farber, Environmental Law in a Nutshell) 


第 四 , 隐 去 是 指 原文 中 的 人 称 代词 主语 ,在 译文 中 不 予 译 出 ,可 根据 交际 语 境 
或 上 下 文 加 以 判断 。 如 : 


(7) The words had been there for years, and she had never said them. 

这 和 句 话 已 存 了 多 年 ,但 是 从 来 没有 说 出 来 过 。(Robert James Waller, 
The Bridge of Madison County , 梅 嘉 译 ) 

(8) “What do you have to eat? 

“有 什么 吃 的 东西 ? (Ernest Hemmingway, The Old Man and the Sea, 
RHF) 


这 里 需要 指出 的 是 ,有 时 候 明 示 与 添加 之 间 的 界限 较为 模糊 ,但 因为 两 者 均 为 
显 化 的 表现 形式 ,因而 并 不 影响 数据 的 统计 和 研究 结果 。 
12.3.3 英汉 翻译 中 的 人 称 代词 主语 转换 


以 下 从 文学 和 非 文学 文本 两 种 文体 类 型 来 考察 人 称 代 词 主语 在 英汉 翻译 中 的 
数量 ,频次 和 转换 类 型 。 所 选 英语 原文 语 料 约 18 万 词 , 其 汉语 学 文本 约 8 万 词 , 非 
文学 文本 约 10 万 词 ( 见 表 12. 1) 。 


表 12.1 英汉 翻译 中 人 称 代词 主语 考察 所 选 语 料 


文体 类 型 文本 名 称 原文 字 / 词 数 | 译文 字 / 词 数 
| The Bridge of Madison County i 36620 63221 
文学 文本 “| The Old Man and the Sea 26920 36705 
The Man that Corrupted Hadleyburg 18198 34639 
总 计 81738 134565 
State of the Union Message 5570 | 2300 
FATRE Administrative Law ; 96971 197 690 
总 计 102541 199990 


文学 文本 包括 The Bridge of Madison County (« Ji §fi8 3), Robert James 
Waller 著 , 梅 嘉 译 ) . The Old Man and the Sea (# A 533), Ernest Hemmingway 
著 , 吴 劳 译 ) 和 The Man that Corrupted Hadleyburg 《败坏 了 赫 德 来 堡 的 人 》， 
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Mark Twain 著 , 常 健 译 ); 非 文学 文本 包括 State of the Union Message(《 国 情 咨 
文 》,George W. Bush) 和 Administrative Law and Process in a Nutshell(《 行 政法 
#2), Ernest Gellhorn & Ronald M. Levin)®, 

同时 以 汉语 原创 文本 作为 参照 库 , 所 选 汉 译 英汉 语 原文 语 料 约 17 万 字 , 其 汉 
语 学 文本 约 9 万 , 非 文学 文本 约 8 万 字 ( 见 表 二 ) ,基本 保证 了 类 比 语 料 的 平衡 。 


表 12.2 汉语 非 翻 译文 本 参照 库 所 选 语 料 


文体 类 型 文本 名 称 原文 字 / 词 数 
《围城 )1~3 章 65 386 
文学 《骆驼 祥子 六 ~~3 章 16770 
RR) y 12693 
总 计 94.849 
非 文学 “| 《政府 白皮书 2》 71956 
__|《 在 中 国共 产 党 全 国 代表 会 议 上 的 讲话 》 3726 
总 计 75682 


文学 文本 包括 (围城 (1~3 章 )》( 钱 钟 书 著 ,Jeanne Kelly & Nathan K. Mao 译 )、 
《骆驼 祥子 (1 一 3 章 )》( 老 舍 著 , 施 晓 蔷 译 ) 和 《春蚕 (茅盾 著 ,Sidney Shapiro 译 ); 非 文 
学 文本 包括 《政府 白皮书 2》 和 邓小平 6 在 中 国共 产 党 全 国 代表 会 议 上 的 讲话 )2。 

12.3.3.1 英语 原文 与 其 对 应 汉语 译文 中 人 称 代词 主语 比较 

以 下 首先 从 数量 和 频次 两 方面 考察 英语 原文 与 对 应 汉语 译文 中 人 称 代词 主语 
的 使 用 情况 。 借 助 “ 汉 英 对 应 语料库 ”的 自动 检索 工具 和 词 频 统计 功能 ,同时 对 非 
主语 的 人 称 代词 形式 加 以 排除 ,英语 原文 和 对 应 汉语 译文 中 人 称 代词 主语 的 数量 
与 频次 统计 如 下 ( 见 表 12. 3): 


表 12.3 英语 原文 与 其 汉语 译文 中 的 人 称 代词 主语 


文体 类 型 文学 文本 非 文学 文本 
文 本 英语 原文 “| ”汉语 译文 英语 原文 汉语 译文 
大 小 ( 字 / 词 ) 81738 | 134565 102541 199990 


人 称 代词 主语 
HAK Ho) 


s251 | 3905 352 242 


64. 24 29. 02 


© 非 文 学 文本 统一 不 注 明 译 者 。 

@ ”限于 篇 幅 , 本 章节 选 (围城 ) 和 《骆驼 祥子 ) 两 个 文本 各 三 章 内 容 作为 语 料 ;《 政 府 白皮书 2》 
共 包 含 六 个 文本 :1)《 中 国 海洋 事业 的 发 展 );2)《 中 国 的 劳动 和 社会 保障 状况 ;3)《 中 国 的 农村 扶 
贫 开 发 );4)《 西 藏 文化 的 发 展 白皮书 》;5)《 中 国 的 航天 白皮书 》;6《 中 国 知识 产权 保护 状况 》。 
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根据 表 12. 3, 英 语文 学 文本 原文 约 8 万 词 ,人 称 代词 主语 出 现 约 5 251 次 , 频 
次 为 约 每 千 词 64 次 ,对 应 汉语 译文 约 13 万 字 , 人 称 代词 主语 约 3 905 个 ,频次 为 约 
ETF 29 个 ; 非 文学 文本 英语 原文 约 10 万 词 , 人 称 代 词 主 语 的 频次 为 3. 43%o, 而 
对 应 汉语 译文 为 1. 21%o。 

从 数量 与 频次 上 看 ,英汉 翻译 中 人 称 代词 主语 的 数量 与 频次 均 有 所 降低 (如 图 
12. 1 所 示 ) 。 


回 英 语 原文 
国 汉 语 译文 


非 文学 
图 12. 1 英语 原文 与 汉语 译文 中 的 人 称 代词 主语 
英汉 转换 中 人 称 代词 主语 在 数量 与 频次 均 表现 出 降低 的 趋势 ,文学 翻译 中 降 
低 幅 度 为 35. 22%o, 非 文学 翻译 中 降低 2. 22%。。 由 此 可 初步 说 明 , 若 将 人 称 代词 主 
语 视 为 语言 形式 化 程度 的 一 个 标志 ,那么 汉语 对 人 称 代词 主语 的 依赖 程度 通常 要 
低 于 英语 ,这 一 点 还 有 待 于 下 文 进一步 论证 。 
12.3.3.2 英 译 汉 过 程 中 的 人 称 代词 主语 转换 
以 下 对 英 译 汉 时 人 称 代词 主语 的 具体 转换 类 型 加 以 考察 ,主要 考察 英语 人 称 代词 
主语 在 翻译 到 汉语 过 程 中 所 表现 出 的 对 应 ,明示 和 添加 现象 ( 见 表 12. 4 和 表 12. 5) 。 
表 12.4 英 译 汉文 学 文本 人 称 代词 主语 转换 类 型 


文本 名 称 
《老人 与 海 》 | 1323 | 1283 | 96.98 | 28 2.12 12 0.91 
《 廊 桥 遗 梦 ) | 1834 | 1773 2.67 | 12 | o65 
《败坏 了 替 德 莱 堡 的 人 》 56 7.49 
总 计 


根据 表 12. 4, 英 译 汉文 学 文本 中 人 称 代词 主语 转换 类 型 主要 以 对 应 关系 为 
主 , 占 到 总 考察 句 数 的 94. 31% , 远 远 高 于 明示 与 添加 之 和 5.69%. 
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表 12.5 英 译 汉 非 文学 文本 人 称 代词 主语 转换 类 型 


文本 名 称 ac eae 
句 数 句 数 
(%) (%) 
《国情 咨文 》 97.78 3 2.22 0 0 
《行政 法 概要 》 | 107 67 |62.62| 19 |1776| 21 | 19.63 
总 计 ý 


非 文学 文本 中 ,人 称 代词 主语 转换 情况 与 文学 文本 相同 ,对 应 关系 占 82. 23%, 
大 大 过 于 明示 和 显 化 之 和 17. 77% 。 对 英汉 翻译 中 人 称 代词 主语 的 转换 类 型 按照 
对 应 与 显 化 (包括 名 示 与 添加 ) 加 以 归纳 (如 图 12. 2 所 示 ) : 


图 对 应 
mrt 


0 =. ~- 
文学 非 文 学 


图 12.2 英 译 汉文 学 与 非 文学 翻译 中 的 人 称 代词 主语 转换 

无 论文 学 还 是 非 文学 文本 ,就 所 考察 的 英汉 翻译 中 人 称 代词 主语 转换 来 看 ,对 
应 关系 表现 突出 , 语 际 显 化 不 明显 。 根 据 图 12. 2 还 可 看 出 ,英语 文学 文本 中 对 人 
称 代词 主语 的 使 用 比较 丰富 ,而 对 应 汉语 译文 中 却 大 大 减少 ,从 这 一 点 也 体现 出 
英 、 汉 语 对 人 称 代词 主语 的 依赖 程度 差异 ,结合 以 上 汉 英 翻译 中 关于 人 称 代词 主语 
的 讨论 ,从 一 个 侧面 也 说 明了 汉语 在 构 句 层面 上 意 合 的 特点 。 如 果 可 以 将 人 称 代 
词 主语 作为 语言 形式 化 程度 的 一 个 参数 ,那么 与 英语 相 比 汉语 的 形式 化 程度 相对 
要 低 一 些 。 英 汉 翻 译 中 人 称 代词 主语 的 语 际 隐 化 表现 如 下 ( 见 表 12. 6 和 表 12. 7) 


表 12.6 英汉 文学 翻译 中 人 称 代词 主语 的 语 际 隐 化 


类 型 英汉 对 应 语 际 隐 化 
工人 称 1141 | 72.68% | 429 27.32% 
ea DAR | 347 | 82.03% | 76 | 17.97% 
开 人 称 2195 67.37% | 1063 48.43% 


总 计 5251 3683 70. 14% 1568 29. 86% 
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表 12.7 英汉 非 文学 翻译 中 人 称 代词 主语 的 语 际 隐 化 


类 型 英语 显 性 英汉 对 应 语 际 隐 化 
LAK 118 116 98.31% 2 | 1.69% 
ATR LAK 10 6 60% 4 | 4% 
AEE IA 224 77 | 34.38% | ”147 | 65.63% 
总 计 352 199 56. 53% 153 43, 47% 


根据 表 12. 6 和 表 12. 7, 英 语 原文 中 的 显 性 人 称 代词 主语 在 翻译 转换 中 总 体 上 
都 以 对 应 关系 为 主 ,文学 文本 中 为 70. 14% , 非 文学 文本 中 为 56. 53% , 语 际 隐 化 分 
别 占 29. 86% 和 43. 47%。 需 要 指出 的 是 , 非 文学 文本 中 第 三 人 称 代词 主语 在 英汉 
转换 中 表现 出 语 际 隐 化 的 趋势 , 主要 原因 在 于 第 三 人 称 回 指 在 英语 中 比较 广泛 。 
可 以 发 现 :英汉 翻译 中 人 称 代词 主语 的 转换 ,数量 与 频次 上 呈 递 减 趋 势 ,转换 类 型 
上 则 以 对 应 关系 为 主 , 语 际 显 化 不 明显 , 语 际 隐 化 总 体 不 明显 。 
12.3.3.3 汉语 翻译 文本 与 非 翻 译文 本 中 人 称 代词 主语 比较 
上 文 分 别 对 人 称 代 词 主语 在 文学 与 非 文 学 两 种 文体 类 型 中 的 数量 、 频 次 和 转 
换 类 型 进行 了 考察 。 初 步 表 明 : 文 学 与 非 文学 文本 中 都 表现 出 人 称 代词 主语 的 数 
量 和 频次 的 减少 ;就 转换 类 型 看 , 语 际 显 化 和 语 际 隐 化 均 不 大 明显 。 以 下 通过 对 汉 
语 翻译 文本 和 非 翻译 文本 中 人 称 代词 主语 使 用 的 比较 ,来 讨论 类 比 显 化 现象 。 汉 
语 翻译 文本 与 汉语 非 翻 译文 本 中 人 称 代词 主语 的 频次 表现 如 下 ( 见 表 12. 8): 
表 12.8 汉语 翻译 文本 与 非 翻 译文 本 中 人 称 代词 主语 比较 
zeza 文学 文本 非 文学 文本 
| 汉语 翻译 文本 ee 汉语 翻译 文本 | 汉语 非 翻译 文本 
are 134565 94849 199990 75682 
人 称 代词 主语 3905 1608 242 29 


频次 (%o) 29. 02 16. 95 1. 21 0.38 


由 表 12. 8 可 以 看 出 ,文学 文本 中 ,人 称 代词 主语 在 翻译 文本 和 非 翻 译文 本 中 
的 频次 分 别 为 29. 02% oF 16. 95%o, 平 均 每 千 字 多 出 约 12 个 ; 非 文学 文本 中 ,分 别 
为 1.21%o 和 0. 38%o, 平 均 每 千 字 约 多 一 个 。 由 此 可 以 看 出 ,无 论文 学 还 是 非 翻译 
文本 ,与 汉语 非 翻译 文本 相 比 ,汉语 翻译 文本 中 人 称 代词 主语 的 使 用 频次 要 高 。 结 
合 以 上 讨论 可 以 做 出 推论 :英汉 翻译 中 ,翻译 文本 由 于 受 原 语文 本 的 影响 ,表现 出 
人 称 代词 主语 迁移 ,导致 其 频次 的 增加 。 人 称 代词 的 回 指 和 预 指 的 作用 是 明示 语 
篇 中 人 际 关 系 的 主要 手段 之 一 ,因此 人 称 代词 主语 的 增加 说 明 汉语 翻译 文本 呈现 
类 比 显 化 的 趋势 。 
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12.4 对 翻译 中 显 化 的 认识 


通常 认为 ,翻译 转换 中 所 表现 出 来 的 一 些 特征 完全 是 由 于 语言 系统 具体 差异 
的 结果 ,但 基于 语料库 的 实证 研究 (Overas,1998; Olohan & Baker, 2000 等 ) 表 明 
翻译 中 的 显 化 在 许多 情况 下 确 属 于 一 种 非 强制 性 的 策略 , 即 并 非 译 语文 本 的 绝对 
要 求 。 如 前 文 所 讨论 的 英汉 翻译 中 人 称 代词 主语 在 译文 中 添加 或 明示 与 否 , 均 不 
是 译文 语言 系统 所 强制 要 求 的 。 但 不 同 语 对 (language pair) 间 的 翻译 是 否 具有 相 
同 的 共性 呢 ? 现 有 实证 研究 仅 限 于 具体 语 对 中 就 特定 语言 项 的 考察 ,难免 停留 在 
对 局 部 共性 的 研究 上 。 抛 开具 体 语 对 的 约束 ,可 以 从 语言 形式 化 程度 的 角度 将 这 
些 局 部 共性 统一 起 来 。 这 里 所 谓 “ 语 言 形 式 化 ”(linguistic formalization) 不 同 于 语 
言 分 析 方 法 的 “形式 化 ”(formalization) 。 语 言 分 析 方 法 的 “形式 化 ”是 指 语言 学 , 特 
别 是 生成 语言 学 中 “支配 一 种 分 析 法 的 规则 、 原 则 、 条 件 等 能 以 精确 和 严格 的 方式 
界定 ”, 即 “能 用 逻辑 或 数学 术语 对 一 种 语言 分 析 做 出 形式 解释 并 制定 演算 方法 ” 
(〈 克 里 斯 特 尔 2000:146) 。 换 句 话 而 言 , 语 言 分 析 方 法 的 “形式 化 ”就 是 对 语言 分 析 
方法 的 逻辑 化 和 数学 化 。 语 言 形式 化 是 指 某 一 语言 表现 某 种 意义 关系 所 依靠 的 各 
种 方式 ,包括 音调 ,语序 、 届 折 变 化 及 功能 词 等 的 丰富 程度 ,以 及 该 语言 对 这 些 形式 
手段 的 依赖 程度 。 昌 叔 湘 (1999:7) 提 出 “汉语 语法 的 最 大 特点 是 没有 严格 意义 的 
形态 变化 ”, “没有 严格 意义 上 的 形态 变化 ,在 语法 分 析 上 就 容易 引起 问题 "。 昌 权 
湘 \ 朱 德 银 (1979:10) 指 出 , 正 是 “由 于 汉语 缺少 发 达 的 形态 ,许多 语法 现象 就 是 浙 
变 而 不 是 顿 变 , 在 语法 分 析 上 就 容易 遇 到 各 种 “中 间 状 态 '”。 这 里 所 谓 “ 发 达 的 形 
态 ” 是 指 西 方 语言 中 的 各 种 形态 变化 形式 (如 性 , 数 , 格 时、 体 、 语 态 、 词 类 标记 等 )， 
相对 而 言 ,汉语 在 这 方面 比较 缺乏 ,使 范畴 与 范畴 之 间 并 非 泾 渭 分 明 , 造 成 语言 分 
析 的 困难 。 目 前 ,对 语言 形式 化 程度 这 一 问题 的 探讨 较 少 ,但 不 同 语言 在 以 各 种 形 
式 手段 表达 意义 及 意义 关系 方面 均 表现 出 各 自 的 典型 特征 ,这 一 现象 客观 存在 。 
而 且 从 语言 本 质 差异 人 手 , 对 揭示 翻译 转换 中 各 种 现象 的 本 质 举 足 轻重 。 从 语法 
角度 讲 , 语 言 形式 化 程度 是 指 一 种 语言 中 基本 形式 手段 的 多 赛 ,和 该 语言 依赖 各 种 
形式 手段 表达 语义 关系 的 程度 ,形式 手段 多 并 且 对 其 依赖 程度 高 的 语言 ,我们 就 说 
其 形式 化 程度 高 ,反之 则 形式 化 程度 低 。 

柯 飞 (2005:307) 指 出 ,翻译 的 中 显 化 和 隐 化 可 由 多 种 因素 造成 ,具体 包括 语言 
因素 ,文本 因素 、 译 者 因素 和 社会 文化 因素 。 其 中 前 两 类 属于 语言 内 因素 ,后 两 者 
是 语言 外 的 因素 ,具体 包括 人 类 认 知 规律 和 语言 相对 社会 地 位 的 差异 两 个 方面 。 
从 人 类 的 认 知 规律 上 讲 , 我 们 总 是 依靠 已 知 的 东西 来 认识 未 知 的 东西 ,这 一 点 体现 
在 翻译 中 就 是 显 化 现象 。 另 一 方面 ,语言 使 用 中 的 经 济 原则 又 要 求 以 最 节约 的 形 
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式 来 表达 各 种 意义 和 意义 关系 ,在 翻译 中 则 体现 为 隐 化 。 语 言 之 间 的 相对 社会 地 
位 ,是 指 不 同 语言 之 间 在 不 同 社会 时 期 由 于 政治 ,经济 、 国 力 等 因素 在 相互 交流 所 
表现 出 的 不 同 地 位 ,就 翻译 而 言 具体 可 体现 在 翻译 策略 和 翻译 产品 的 “顺差 "与 “ 逆 
差 ” 问 题 两 方面 。 从 弱势 语言 向 强势 语言 的 翻译 (如 汉 译 英 、 芬 译 俄 等 ), 语 际 显 化 
的 趋势 相对 比较 突出 ;而 由 强势 语言 向 弱势 语言 的 翻译 中 ,翻译 文本 的 类 比 显 化 特 
征 则 比较 明显 。 对 于 显 化 应 当 注意 以 下 几 个 问题 :第 一 , 显 化 并 不 一 定 就 意味 着 添 
加 ,而 且 并 非 所 有 的 添加 都 与 显 化 有 关 ; 第 二 ,不 能 从 本 质 上 将 语言 划分 为 明晰 或 
RE 因为 不 同 语言 会 在 不 同 层面 上 表现 出 明晰 或 含 鞋 的 特点 , 显 化 或 隐 化 存在 于 

: 翻译 转换 过 程 中 ;第 三 ,至 少 在 句子 层面 ,添加 与 省 略 在 翻译 中 总 是 并 存 的 ,但 显 化 
或 隐 化 与 否 还 需要 从 不 同 的 层面 加 以 识别 ,如 句子 层面 的 显 化 并 不 意味 着 语 篇 层 
面 的 显 化 。 


12.5 小 结 


通过 数量 ,频次 和 转换 类 型 三 个 方面 的 考察 发 现 :英汉 翻译 中 ,人 称 代词 主语 
语 际 以 对 应 关系 为 主 , 抛 开 译 者 语言 能 力 因素 ,表现 出 英语 作为 强势 语言 在 译 语文 
本 中 的 迁移 现象 ,造成 译 语 中 的 宛 余 现象 :与 原创 的 汉语 文本 相 比 ,汉语 翻译 文本 
表现 出 类 比 显 化 的 趋势 。 倘 若 将 对 人 称 代词 的 依赖 程度 作为 语言 形式 化 程度 的 一 
个 参数 ,那么 由 形式 化 程度 高 的 语言 翻译 到 形式 化 程度 低 的 语言 时 ,类 比 显 化 突 
出 , 即 翻 译 译文 在 形式 上 比 译 语 中 的 非 翻 译文 本 显 性 程度 高 ;从 文体 类 型 上 讲 , 文 
学 与 非 文学 文本 翻译 中 的 类 比 显 化 表现 均 比 较 高 。 这 一 研究 结果 进一步 说 明 语 言 
形式 化 程度 是 影响 翻译 转换 中 形式 方面 显 化 与 否 的 重要 因素 。 作 为 一 种 翻译 共 
性 ,此 种 形式 上 的 显 化 现象 在 其 他 语 对 中 亦 有 所 表现 (如 匈 译 俄 , 匈 译 英 、 挪 译 英 、 
REM) ,但 还 需要 进一步 的 考察 。 


第 13 章 


英 译 汉 文学 文本 中 人 称 代词 的 变异 


本 章 通过 汉语 翻译 文学 与 汉语 原创 文学 语 料 的 对 比 和 分 析 , 探讨 汉语 翻译 文 
学 文本 中 人 称 代词 使 用 的 特征 。 本 章 发 现 :1) 汉 语 翻 译文 学 中 ,各 类 人 称 代词 的 使 
用 频率 均 高 于 原创 文学 ;2) 第 三 人 称 代词 “他 ”的 复 现 率 明显 提高 ;3)“ 他 ”在 汉语 文 
学 翻译 语 料 中 的 照应 功能 明显 增强 , 出现 了 不 同 指 “ 他 ”交替 的 不 同 于 汉语 语法 常 
规 的 变异 特征 。 我 们 认为 :人 称 代 词语 法 显 化 和 变异 是 汉语 翻译 文学 文本 的 显著 
特征 之 一 。 这 些 特征 可 能 反映 了 英语 等 形态 比较 丰富 的 语言 对 翻译 汉语 的 影响 ， 
体现 了 现代 汉语 翻译 文学 作品 的 陌生 化 操作 规范 。 


13.1 引言 


现代 汉语 中 ,代词 除 具 有 指 别 功能 外 还 有 照应 功能 , 即 与 其 他 语言 单位 构成 同 
指 关系 的 功能 。 王 力 (1989) 把 代词 归 和 人 “ 半 虚 词 ”, 就 是 指 它 的 照应 功能 。 人 称 代 
词 的 照应 功能 可 按 代词 与 名 词性 成 分 的 关系 分 为 同 指 和 异 指 ; 按 先行 词 与 代词 的 
位 置 关 系 分 为 前 向 照应 和 后 向 照应 ,或 称 回 指 Canaphor) 和 前 指 (cataphor)( 徐 超 
超 ,2003); 按 先行 词 与 代词 是 否 同 在 一 个 句子 中 分 为 句 内 照应 和 超 句 照应 ( 董 红 源 
2002:6-8)。 代 词 有 三 类 :人 称 代 词 .指示 代词 和 疑问 代词 ;人 称 代 词 又 分 第 一 、 二 、 
三 人 称 (“三 身 代 词 ”) ,指示 代词 又 分 近 指 和 远 指 。 与 英语 及 其 他 印 欧 语 言 相 比 , 汉 
语 代 词 的 类 型 较 少 ,使 用 频率 较 低 ( 刘 密 庆 1998:445-476; 范 仲 英 1997:148-151) 。 
汉语 人 称 代 词 形式 上 没有 主格 宾 格 之 分 ,代词 所 有 格 与 英语 的 物 主 代词 相 比 使 用 
得 更 少 。 汉 语 常 规 的 指 代 方式 主要 以 “名 词 复 现 ” 和 “ 零 代词 "为 主 , 显 性 人 称 代词 
的 使 用 频率 一 般 较 低 。 

据 Francis 和 Kuzera(1982: 547)、Johansson 和 Hofland (1989; 15, #€3| A 
Leech,2001) 对 BROWN 和 LOB 的 统计 ,“ 想 象 型 " 语 料 比 “信息 型 " 语 料 明显 更 频 
繁 地 使 用 人 称 代词 。 胡 显 焰 (2008:143-147) 对 汉语 语 料 词汇 特征 的 考察 也 表明 汉 
语 小 说 比 其 他 文体 更 倾向 于 使 用 更 多 的 人 称 代词 。 这 说 明 多 使 用 代词 是 英 、 汉 语 
文学 语 料 的 共同 特征 之 一 ,原因 是 以 小 说 为 主 的 文学 语 料 通常 以 对 话 和 叙述 为 主 ， 
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而 叙述 通常 以 第 三 人 称 和 第 一 人 称 为 主 。 

在 使 用 北 外 “英汉 对 应 语料库 ?对 翻译 文学 语 料 的 人 称 代词 的 考察 中 ,我 们 发 
现 :人 称 代词 在 汉语 翻译 文学 语 料 中 的 使 用 频率 、 指 代 功 能 、 照 应 方式 等 具有 明显 
不 同 于 汉语 非 翻 译 ( 原 创 ) 语 料 的 特征 。 总 体 而 言 ,汉语 翻译 文学 语 料 中 人 称 代词 
的 作用 更 类 似 于 英语 的 语法 功能 词 或 虚词 ,换言之 ,汉语 翻译 文学 语 料 比 原创 文学 
语 料 更 倾向 于 指 代 显 化 (explicitation) ,而 不 是 遵循 汉语 常规 ,使 用 名 词 复 现 和 零 形 
代词 的 方式 。 此 外 ,翻译 汉语 中 人 称 代词 的 指 代 功能 显著 增强 ,在 照应 方式 上 出 现 了 
不 同 指 的 “他 ” 同 句 和 后 向 照应 等 一 些 汉语 原创 文本 中 少见 的 变异 特征 (deviation) 。 


13.2 ”人称 代词 的 显 化 


根据 语料库 的 词性 赋 码 ,我 们 分 别 统计 了 各 种 人 称 代词 在 汉语 原创 文学 语 料 ， 
与 之 对 应 的 英语 翻译 文学 语 料 , 英 语 原创 文学 语 料 和 与 之 对 应 的 汉语 翻译 文学 语 
料 中 的 使 用 频次 并 标准 化 了 各 语料库 每 百 万 词 中 人 称 代词 的 数量 。 
由 于 英汉 语 人 称 代词 系统 的 差异 ,我 们 对 统计 数据 进行 了 修正 D。 为 了 全 面 
地 了 解 两 种 语言 的 代词 使 用 特征 ,我 们 将 非 人 称 代词 “ 它 ” 和 “it" 也 列 人 了 考察 和 比 : 
较 范围 。 表 13. 1 统计 了 各 语料库 中 ,主要 人 称 代词 及 其 复数 形式 和 所 有 格 的 频率 。 
表 13.1 汉 英 文学 (翻译 ) 语 料 库 主要 人 称 代词 词 频 比较 
每 百 万 词 原创 汉语 翻译 汉语 原创 英语 翻译 英语 
我 (l,me) 8300 | 14267 15592 7999 
你 (你 们 ,you) 7634 | ssu | 894 10952 
他 Che, him) 11726 | 
ith (she, her) 5 266 6467 8706 11642 
EGD 531 2058 | 14600 8035 
我 们 (we) 1716 2787 2644 3007 


17328 19 149 15 950 


O ”由 于 英语 和 汉语 人 称 代词 的 形态 不 尽 相同 :汉语 无 主格 宾 格 之 分 ;英语 you 的 单 复数 同 
形 ;英语 的 第 三 人 称 复数 有 they 和 them 两 种 形式 ,而 汉语 有 “他 们 、 她 们 和 它们 ”三 种 形式 ;英语 
的 人 称 代词 还 有 反 身 代词 形式 ,而 汉语 以 人 称 代词 加 “自己 ”来 表示 ,等 等 。 为 了 使 两 种 语言 的 
人 称 代词 具有 可 比 性 ,我 们 对 统计 各 语料库 的 数据 进行 了 修正 , 即 “我 "的 英语 对 应 频率 应 该 是 
“了 "及 其 宾 格 “me” 之 合 ;英语 的 you 对 应 汉语 “你 "和 “你 们 ”; they/them 之 合 对 应 “他 们 、 她 们 和 
它们 ”等 等 。 此 外 ,由 于 汉语 人 称 代词 所 有 格 是 通过 加 “的 ”来 实现 的 ,因此 我 们 从 相应 形式 中 扣 
除了 人 称 代词 加 “的 ”的 数量 。 
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(BR) 


每 百 万 词 
他 们 (they, them) 
你 的 (your) 
我 的 (my) 
他 的 (his) 
她 的 (her) 
它 的 (its) 
合计 


对 表 13. 1 的 数据 进行 分 析 , 我 们 可 以 发 现 一 些 英汉 语 人 称 代词 使 用 的 系统 差异 ， 
但 更 重要 的 是 ,汉语 翻译 文学 与 原创 文学 语 料 相 比 ,人 称 代词 使 用 中 呈现 的 特殊 性 : 


13.2.1 英汉 语 人 称 代词 使 用 的 系统 差异 


AR 13. 1 中 的 主要 人 称 代词 总 频率 来 看 ,原创 英语 文学 语 料 中 人 称 代词 总 频 
率 (99 601) 是 原创 汉语 文学 语 料 (41 411) 的 2.4 倍 。 图 13. 1 列举 了 三 个 语料库 的 
主要 人 称 代词 的 词 频 分 布 :最 下 面 的 曲线 是 原创 汉语 文学 语 料 的 人 称 代词 频率 ,最 
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图 13. 1 翻译 汉语 与 原创 英汉 语 人 称 代词 频率 比较 
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上 面 是 原创 英语 文学 语 料 人 称 代 词 频率 的 变化 曲线 。 可 见 , 原 创 汉语 全 部 人 称 代 
词 频 均 显著 低 于 原创 英语 。 

尽管 已 经 有 很 多 研究 表明 英语 的 人 称 代词 使 用 频率 高 于 汉语 ,但 语料库 的 量 
化 研究 使 我 们 能 够 更 准确 地 发 现 汉语 比 英语 少 用 人 称 代词 的 具体 程度 和 在 不 同形 
式 间 的 分 布 。 除 总 词 频 外 , 较 明显 差别 还 有 : 

第 一 ,英语 “it” 的 词 频 是 汉语 “ 它 ” 的 27. 5 倍 , 这 是 由 于 it 在 英语 中 除 充当 代词 
外 ,还 有 作为 先行 词 , 虚 义 词 和 强调 词 等 功能 ( 连 淑 能 ,1993:81-82) 。 

第 二 ,英语 第 三 人 称 “he/him” 及 其 所 有 格 “his” 的 使 用 频率 与 汉语 相 比 有 明显 
差别 。 其 中 “he/him” 为 “他 ”的 1. 6 售 ;“his” 为 “他 的 ”的 7. 6 倍 。 这 一 方面 说 明 汉 
语文 学 语 料 通常 较 少 使 用 人 称 代词 所 有 格 , 另 一 方面 的 原因 可 能 是 his 在 英语 中 
可 同时 兼任 形容 词性 和 名 词性 所 有 格 。 

第 三 ,原创 英语 文学 语 料 第 一 人 称 代词 (I 及 其 宾 格 me) 总 使 用 频率 明显 高 于 
汉语 “我 ”。 

第 四 ,原创 英语 文学 语 料 第 三 人 称 “he/him” 的 词 频 高 于 其 他 英语 人 称 代 词 , 是 
“she/her” 的 两 倍 ;而 汉语 “他 ” 虽 赂 多 与 “她 ”但 无 明显 差别 。 


13.2.2 汉语 翻译 文学 与 原创 文学 人 称 代词 使 用 频率 差异 


图 13. 1 中 间 实 线 为 翻译 汉语 人 称 代词 频率 曲线 。 可 以 清楚 地 看 到 ,除了 由 于 
汉语 语法 规则 的 限制 ,“ 它 ”和 “他 的 ” 远 低 于 英语 的 “it” 和 “his” 的 频率 之 外 ,汉语 翻 
译文 学 语 料 中 人 称 代词 的 分 布 规律 与 原创 汉语 相近 ,但 翻译 汉语 全 部 人 称 代词 的 
使 用 频率 皆 高 于 原创 汉语 。 较 显著 的 差异 是 :1) 第 一 人 称 单数 “我 ”翻译 汉语 是 原 
创 汉 语 的 1. 7 倍 ;2) 第 三 人 称 单数 “他 ”, 翻 译 汉语 是 原创 汉语 的 1. 5 倍 。 

不 少 论 者 在 谈 到 代词 翻译 的 时 候 提 出 ,英语 倾向 于 更 频繁 地 使 用 代词 ,而 汉语 
更 频繁 地 使 用 原 词 复 现 和 “ 零 形 回 指 ”( 即 省 略 代词 或 名 词 ) 的 方式 ,因而 在 翻译 中 
应 少 用 代词 多 用 原 词 复 现 等 方式 ( 冯 庆 华 1997)。 但 从 对 翻译 文学 语 料 中 人 称 代 
词 的 实际 使 用 的 统计 分 析 来 看 ,汉语 翻译 文学 中 人 称 代词 的 实际 使 用 频率 显著 高 
出 原创 文学 , 除 it 和 所 有 格 his/her 外 ,人 称 代词 的 使 用 较 接近 于 英语 。 我 们 把 汉 
语 翻译 文学 中 人 称 代词 的 这 一 特征 称 为 人 称 代词 的 * 显 化 >。 显 化 主要 说 明了 翻译 
汉语 中 人 称 代词 使 用 的 频率 显著 提高 ,但 频繁 使 用 人 称 代词 究竟 会 给 翻译 文本 造 
成 怎样 的 影响 ? 以 下 我 们 详细 考察 人 称 代词 “他 ”的 使 用 及 其 效果 。 


13.3 人称 代 词 的 变异 :以 “他 ”为 例 


语言 学 界 的 人 称 代词 回 指 研究 表明 :第 三 人 称 代词 “他 ”在 汉语 中 具有 特殊 作 
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用 。 罗 选民 (2001:221) 认 为 :“( 人 称 指称 ) 在 汉语 中 最 常见 的 是 使 用 第 三 人 称 代词 
单 复 数 形式 ”; 王 灿 龙 (2000:228) 也 提出 : “在 现代 汉语 系统 中 ,人 称 代词 “他 ?是 使 
用 频率 最 高 的 照应 语 之 一 (“他 ?实际 上 也 指 “ 她 ”他们 ”、“ 她 们 ”)。”( 以 上 转 引 自 
赵 宏 、 邵 志 洪 2002; 封 宗 颖 、 邵 志 洪 2004) 。 徐 超 超 (2003: 106-137) 对 “他 ”的 格 分 
布 .语序 列 和 延续 性 进行 了 统计 研究 。 他 认为 照应 语 之 间 的 语序 列 通 常 是 名 词 最 
先 出 现 接着 以 人 称 代词 、 零 形式 或 名 词 复 现 的 方式 进行 回 指 ,而 代词 和 零 形 式 在 
前 ,名 词 后 出 现 的 前 指 情况 在 汉语 中 虽然 存在 但 非常 少 ;他 还 提出 汉语 照应 语 延 续 
性 强 弱 依次 是 零 形 式 、 代 词 和 名 词 (同上 :111-114)。 延 续 性 实际 上 是 同 指 的 照应 
词 (代词 .名 词 和 零 形式 ) 之 间 的 距离 G。 照 应 词 的 使 用 受 人 物 、 情 节 、 时 间 、 连 词 和 
结构 等 的 制约 (同上 :130-137)。 本 章 以 下 具体 分 析 “ 他 ”在 翻译 和 原创 文学 语 料 中 
的 使 用 特征 :其 一 ,“ 他 ”的 复 现 率 。 其 二 ,多 “他 ” 同 句 的 频率 及 特征 ,包括 1)“ 他 ” 
的 指 代 能 力 ;2) 多 “他 ” 同 句 ;3) 不 同 指 “ 他 ”交替 使 用 等 。 


13.3.1 “他 ”的 复 现 率 


本 章 的 “ 复 现 率 ” 指 两 个 “他 ”之 间 相隔 的 距离 。 这 个 概念 是 受 回 指 理论 的 “ 延 
续 性 ”影响 产生 的 ( 徐 超 超 2003)。 所 谓 延续 性 实际 上 就 是 同 指 的 照应 词 (代词 .名 
词 和 零 形式 ) 之 间 的 距离 。 篇 章 语言 学 是 通过 “ 回 数 法 ”来 计算 同 指 词 之 间 小 句 的 
数量 。 这 种 方法 适用 于 小 规模 的 篇 章 分 析 , 但 对 于 上 千 万 字 词 的 语料库 而 言 ,人 工 
回 数 小 句 是 不 现实 的 。 故 本 章 用 复 现 率 的 概念 来 计算 代词 和 名 词 的 “延续 性 ”, 具 
体 方法 是 : 复 现 率 = 语料库 的 句子 数 二 “他 ”的 实际 频率 。 复 现 率 的 意义 是 衡量 语 
料 库 中 “他 ”与 “他 ”之 间 平 均 相隔 多 少 个 句子 ,也 就 是 各 个 “他 ”之 间 的 平均 距离 。 
复 现 率 的 值 越 大 ,代词 之 间 相 隔 的 距离 越 远 。 为 了 比较 翻译 文学 语 料 中 人 名 和 
“他 ”的 复 现 率 ,我 们 分 别 计算 了 各 语料库 中 “他 ”和 人 名 的 复 现 率 , 见 表 13. 20, 
表 13.2 各 语料库 中 “他 "和 人 名 的 复 现 率 
原创 汉语 | mexa | 原创 英语 mR 
句 数 30070 39963 | 41159 36107 
他 Che/him) | 6582 13092 | n 13577 


@ 具体 方法 是 用 采用 “ 回 数 法” 数 出 指 同 代词 或 名 词 (token) 之 间 的 小 句 数 量 (value) ,再 用 
该 值 除 以 代词 或 名 词 的 数量 得 到 平均 每 隔 n 个 小 句 出 现 的 代词 或 名 词 数 ( 徐 超 超 2003:111- 
114). 

DAR BAIA BN TES PE AY SER ET. OP HR a AA 
“he/him” 为 “he”&“him” 频 次 之 和 ,不 含 “his”。 
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( 续 表 ) 
原创 汉语 翻译 汉语 原创 英语 翻译 英语 
aag | 4.57 3o | 32 | 2e 
人 名 19671 12212 一 一 
复 现 率 1.53 3.27 一 一 


从 表 13. 2 我 们 可 以 看 到 ,原创 汉语 文学 语 料 中 的 “他 ”的 复 现 率 为 4. 57, 其 含义 
为 :平均 每 隔 4. 57 个 句子 会 出 现 一 个 “他 ”。 翻译 汉 语文 学 中 “他 ”的 复 现 率 为 3. 05， 
即 约 每 隔 3 个 句子 出 现 一 次 。 显 然 ,原创 汉语 中 “他 ”的 平均 距离 明显 大 于 翻译 汉 
语 。 另 一 方面 ,一 般 认为 汉语 倾向 于 使 用 “名 词 复 现 ” 的 指 代 方式 ,为 了 证 实 这 个 看 
法 ,我 们 也 统计 了 汉语 语料库 中 人 名 的 复 现 率 。 结 果 发 现 :翻译 汉语 文学 中 人 名 的 
平均 距离 (3. 27) 明 显 高 于 原创 汉语 文学 (1. 53) 。 简 言 之 , 语 料 统计 表明 ,翻译 汉语 
文学 中 “他 ”更 为 密集 ,人 名 则 更 为 稀 朴 。 

由 于 “ 汉 英 对 应 语料库 ?由 英汉 双向 的 原创 和 翻译 语 料 构成 ,故我 们 也 以 同样 
的 方法 计算 了 英语 语 料 中 的 “he/him” 的 复 现 率 。 可 以 看 到 ,翻译 英语 中 “he/him” 
也 比 原创 英语 更 为 密集 。 这 是 否 能 在 一 定 程度 上 说 明 “ 显 化 ”是 翻译 汉语 和 翻译 英 
语 的 共同 特征 ,还 有 待 进一步 考察 。 应 当 指 出 的 是 ,上 述 计算 方法 只 能 非常 粗略 地 
比较 “他 ?或 人 名 在 语料库 中 的 平均 距离 ,而 未 考虑 原创 汉语 和 翻译 汉语 的 句子 长 
度 。 对 于 具体 篇 章 的 “他 ”更 适合 用 延续 性 来 考察 其 回 指 特征 。 


13.3.2 多 “他 "同名 


同一 句子 中 出 现 多 个 他 的 现象 在 现代 汉语 中 并 不 少见 ,但 一 般 而 言 ,汉语 更 倾 
向 于 用 “ 零 形 回 指 ” 或 名 词 复 现 的 方式 来 进行 照应 。 先 来 看 多 “他 ” 同 句 的 频率 ,我 
们 对 原创 汉语 文学 和 文学 翻译 语 料 中 2 一 6 个 “他 ”在 同一 句子 中 共 现 的 频率 进行 
了 统计 ， 


表 13.3_ 多 "他 " 同 句 的 频率 
原创 汉语 翻译 汉语 
原始 频率 每 百 万 词 原始 频率 每 百 万 词 
总 频率 7666 13658 15447 20445 


2“ 他 ”同名 1708 j 3043 4202 5562 
377 


3* 他 ” 同 句 672 1128 1493 
4 他 ”同名 87 155 311 412 
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(BR) 
原创 汉语 翻译 汉语 
原始 频率 每 百 万 词 原始 频率 每 百 万 词 
5“ 他 ”同名 26 46 93 | 123 
6" Hh” FA) 10 18 29 38 


由 表 13. 3 可 见 , 汉 语 翻 译文 学 语 料 中 同一 个 句子 中 多 个 “他 ”连用 的 现象 比 汉 
语 原创 文学 高 很 多 。2 一 6 他 ”同名 的 情况 ,翻译 汉语 几乎 都 是 原创 汉语 的 两 倍 多 。 
因此 ,相对 来 说 ,同一 句子 中 多 个 “他 ”并 用 的 现象 在 翻译 文学 语 料 中 是 较 常见 的 现 
象 如 例 (1) ,而 汉语 通常 采用 人 名 与 “他 ”交替 使 用 的 方式 如 例 (2) 。 而 例 (3) 这 样 同 
一 句子 中 出 现 多 个 音译 人 名 的 情况 ,在 翻译 文学 语 料 中 出 现 的 情况 很 少 ,该 句 读 起 
来 非常 吃力 ,人 名 音译 加 重 了 读者 的 阅读 负担 。 


D 那 顶 帽子 使 他 很 是 为 难 ,他 刚 想 往 上 衣 口 袋 里 塞 的 时 候 就 被 前 面 的 
人 夺 了 过 去 , 那 动作 既 轻 巧 又 自然 ,不 由 得 这 位 笨拙 的 年 轻 人 心里 不 感激 。 
“他 能 体谅 人 ," 他 想 ,“ 他 准 会 帮 俺 帮 到 底 的 .”(《 马 丁 。 伊 登 )D) 

(2) 但 他 没有 走 远 ， 他 只 是 在 一 个 别人 不 注意 的 地 方 衙 起 来 ,他 要 跟着 红 
PERE 王 新 一 一 他 断定 红 艳 一 定 要 找 王 新 的 。 

(S) 波 里 娜 。 盖 奥 尔 吉 耶 芙 娜 虽然 没有 向 奥 列 格 说 明 刘 季 柯 夫 叫 他 和 杜 
和 尔 根 尼 奇 去 的 晨 什 么 地 方 , 但 是 杜 尔 根 尼 奇 立 刻 猜 到 ,这 是 通 往 游 击 队 的 道 
路 。(( 青 年 近 卫 军 》) 


13.3.3 不 同 指 多 “他 "同名 


值得 注意 的 是 ,如 果 一 段 篇 章 中 有 多 个 人 物 交替 出 现 ,汉语 通常 都 会 以 人 名 来 
指 代 , 一 般 不 会 在 同一 句子 中 同时 使 用 多 个 不 同 指 的 “他 ”。 然 而 ,我 们 对 翻译 文学 
语 料 中 多 “他 ”同名 的 索引 和 分 析 中 发 现 ,翻译 文学 语 料 中 存在 不 少 不 同 指 “ 他 ”在 
同一 句 话 中 出 现 的 例句 : 


(4) 他 背 上 的 孩子 会 不 会 突然 掉 下 来 ,他 。 腰 上 的 孩子 会 不 会 因为 他 


父亲 的 动作 打扰 了 他 的 美梦 面 大 声 蹄 器? (《 本 性 )[ 他 ws 同 指 父亲 ,他 , 指 
小 孩 , 两 个 不 同 指 “他 "交替 ] 


外 ”以 下 部 分 例句 来 自 “当代 汉语 翻译 小 说 语料库 ”(CCTFC) ,参见 胡 显 雹 (2007) 。 
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O fit 作为 军事 审判 官 决定 的 事 , 只 有 作为 文职 特派 员 的 他 才能 改变 。 
《《 九 三 年 [他 他 。 各 为 两 人 ,两 个 不 同 指 “ 他 "交替 ] 

(6) 像 这 样 被 拖 上 街 以 前 , 别 的 孩子 就 不 止 一 次 大 声 喊 他 ,, 训 笑 他 : 父 
RMR: 老 是 当众 宣扬 他 , 的 宗教 信仰 。C《 美 国 的 悲剧 [他 , 他 指 儿子 ， 
他 他 , 指 父亲 ] 

C7) 他 : 特别 指 给 他 : 看 一 个 胖子 ,这 人 脸 上 流露 出 天 真 和 善 的 神情 , 懒 洋 
洋 地 倚 在 他 ， 身边 一 个 女 伴 的 肩 上 ， 用 充满 父 爱 的 眼神 深情 地 注视 着 他 , 的 女 
伴 一 一 个 淳朴 的 年 轻 姑娘 。C《 娜 娜 [他 他 : 和 他 分 别 三 人 ,三 个 不 同 指 
“他 "交替 ] 

(8) 他; 又 一 次 挥动 左手 , 击 中 了 那个 炮 手 , 炮 手 向 他 : 扑 过 来 , 抓 住 了 他 ; 
WEAR, ak FT fh. 的 袖子 ,他 往 他 s 的 耳朵 后 面 狠 狠 搂 了 两 拳 ， 接着 在 他 , 把 
他 推 开 的 时 候 ， ,又 用 右手 把 他 。 击 倒 在 地 。(《 海 明 威 短篇 小 说 选 )[ 共 出 现 9 
个 “他 ”, 他 14 同 指 一 人 ,他 到 他 。 很 难 分 清 所 指 。] 


我 们 在 汉语 原创 语料库 中 未 发 现 上 述 这 种 同一 句子 中 多 个 不 同 指 的 “他 ”交替 
使 用 的 情况 。 从 汉语 的 角度 来 看 ,这 种 不 同 指 “ 他 ”混用 容易 造成 语义 含混 ,让 读者 
分 不 清 “ 他 ”的 所 指 。 我 们 认为 ,这 种 现象 可 能 有 三 个 方面 的 原因 :一 是 原文 如 此 ， 
英语 等 语言 的 句法 结构 层次 清楚 ,因此 出 现在 主 句 和 从 名 中 的 he/him/his 很 容易 
从 句法 形式 上 得 到 区 分 , 故 不 同 指 的 he/him/his 同 句 也 不 会 造成 歧义 。 二 是 由 于 
翻译 文学 语 料 中 人 名 音译 复杂 元 长 的 客观 情况 , 译 者 在 译文 中 无 法 采用 人 名 复 现 
的 方式 来 明确 代词 所 指 。 三 是 在 使 用 “他 ”还 是 使 用 零 形 回 指 两 种 选择 中 , 多数 译 
者 选择 了 “他 ”的 复 现 ,这 体现 了 翻译 显 化 这 一 基本 取向 ,因为 “他 ”的 复 现 至 少 相对 
与 零 形 回 指 来 说 更 为 明确 一 些 。 然 而 , 译 者 没 想到 的 是 不 同 指 的 “他 "交替 使 用 反 
而 造成 了 译文 的 含混 和 歧义 。 因 此 ,我 们 认为 ,人 称 代词 “他 ”的 不 同 指 同 句 是 一 种 
变异 的 翻译 操作 。 


13.4 小 结 


综 上 所 述 ,翻译 文学 语 料 中 各 种 人 称 代词 ,尤其 是 第 三 人 称 代词 “他 ”的 使 用 频 
率 显 著 高 于 原创 文学 语 料 。 与 英语 原创 小 说 相 比 ,英语 翻译 文学 语 料 除了 it 和 人 
称 代词 的 所 有 格 频率 较 低 外 ,其 他 人 称 代词 的 频率 都 呈现 出 与 英语 原创 文学 语 料 
相似 的 高 频率 。 人 称 代词 在 翻译 文学 语 料 中 的 复 现 率 显著 区 别 于 原创 文学 语 料 和 
汉语 总 体 ,“ 他 ”之 间 的 距离 相隔 更 短 。“ 他 ”在 翻译 文学 语 料 中 的 照应 功能 显著 增 
强 ,明显 不 同 于 原创 文学 语 料 更 多 使 用 “ 零 形 回 指 ” 的 趋势 。 人 称 代词 的 增多 和 不 
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同 指 的 “他 ”交叉 使 用 做 法 客观 上 产生 了 变异 的 效果 。 

本 章 认为 ,人 称 代词 显 化 的 原因 可 能 与 英语 等 外 国文 学 (主要 是 小 说 ) 的 性 质 
有 关 : 一 是 人 称 代词 所 指 代 的 人 物 的 姓名 译 为 汉语 一 般 采 取 音 译 的 方式 。 在 汉语 
读者 看 来 ,外 国人 名 显得 宛 长 怪异 。 翻 译 中 若 让 这 些 宛 长 和 怪异 的 姓名 不 断 “ 原 词 
复 现 ”显然 是 自 找 麻烦 ,降低 了 小 说 的 可 读 性 。 第 二 ,对 英语 等 欧洲 语言 来 说 ,人 称 
代词 ,尤其 是 第 三 人 称 代词 的 语 篇 照应 功能 很 强 ,人 称 照应 是 语 篇 衔接 的 重要 手 
段 。 从 欧洲 语言 翻译 人 汉语 ,第 三 人 称 “ 他 ”明显 多 于 其 他 人 称 ,可 能 也 反映 了 这 一 
特征 。 因 为 第 三 人 称 代词 除了 具有 指 别 的 功能 外 ,还 有 第 一 、 二 人 称 代词 所 不 具备 
的 照应 功能 。 

然而 ,为 什么 翻译 文学 语 料 中 没有 使 用 汉语 常见 的 “ 零 形 回 指 ” 而 是 选择 了 反 
复 使 用 第 三 人 称 代词 呢 ? 这 种 “他 他 "不 已 的 现象 是 出 于 怎样 的 翻译 操作 规范 ? 对 
译文 又 造成 了 什么 影响 ? 我 们 认为 汉语 翻译 文学 人 称 代词 的 差异 性 特征 反映 了 现 
代 汉语 文学 (小 说 ?翻译 的 显 化 和 变异 的 操作 规范 , 即 外 译 汉 的 小 说 翻译 者 在 汉语 
的 意 合 特征 与 欧洲 语言 的 形 合 特征 两 者 之 间 的 实际 选择 是 倾向 于 语法 显 化 或 “ 形 
合 "。 语 法 显 化 的 总 体 目标 是 通过 语法 关系 的 明确 化 ,降低 文本 阅读 难度 ,增强 翻 
译文 本 可 接受 性 。 但 从 汉语 翻译 文学 的 实际 结果 来 看 , 显 化 的 结果 未 必 一 定 能 降 
低 翻译 文本 的 阅读 难度 ,有 时 反而 出 现 了 对 汉语 语法 规范 的 偏离 和 变异 。 


第 14 章 


基于 语料库 的 翻译 文体 研究 


现代 文体 学 的 发 展 为 翻译 研究 带 来 了 新 的 启示 ,本 章 从 文体 与 翻译 之 间 的 关 
系 人 手 ,在 前 人 研究 的 基础 上 ,尝试 建立 基于 语料库 的 翻译 文体 学 研究 框架 , 即 借 
助 语料库 软件 工具 ,采用 语 际 对 比 和 语 内 类 上 比 相 接合 的 模式 ,从 语言 形式 和 文学 叙 
事 两 个 视角 对 各 类 翻译 文本 的 文体 特征 进行 量化 描写 .分 析 和 解释 ,发 现 翻译 文本 
不 同 于 一 般 文本 的 原因 ,进一步 认识 翻译 的 本 质 。 


14.1 引言 


文体 学 与 翻译 研究 均 拥 有 悠久 的 历史 ,但 现代 文体 学 发 展 成 为 一 门 有 影响 力 
的 独立 学 科大 约 是 在 20 世纪 初 ,翻译 研究 开始 作为 一 门 独立 学 科大 约 是 在 20 世 
纪 70,80 年 代 。 但 文体 学 与 翻译 研究 相 结 合 却 是 近年 来 才 引 起 了 学 者 们 的 关注 。 
申 丹 (1995:1) 在 讨论 文学 文体 学 与 小 说 翻译 的 关系 时 指出 ,文学 翻译 这 一 领域 本 
应 十 分 适宜 进行 文体 研究 ,但 将 文体 学 应 用 于 文学 翻译 的 尝试 至 少 就 英汉 两 种 语 
言 来 说 较为 少见 。Boase- Beier(2004) 指 出 ,多 年 以 来 文体 学 研究 成 果 对 翻译 研究 
的 影响 出 奇 的 小 ,翻译 研究 中 的 见解 也 较 少 带 有 文体 学 的 因素 ,造成 这 两 个 领域 缺 
乏 互 动 的 原因 在 于 :第 一 ,文体 学 研究 的 单 语 性 质 ;第 二 ,近年 来 的 翻译 研究 更 多 地 
关注 于 文学 和 文化 研究 所 带 来 的 启示 。 随 着 语料库 研究 范式 的 建立 ,译作 取向 
(translation-oriented) 的 翻译 文体 研究 逐步 发 展 了 起 来 ,有 代表 性 的 包括 Bosseaux 
(2004), Millan-Varela ( 2004 ), Baker (2000)、 Olohan (2004)、Marco ( 2004), 
Malmkjaer(2003,2004) 等 。 本 章 根据 这 一 领域 现 有 的 成 果 , 结 合 文体 学 与 翻译 研 
究 的 发 展 ,尝试 建立 一 个 基于 语料库 的 翻译 文体 学 研究 (corpus-based translational 
stylistics) 框 架 , 目 的 在 于 将 语料库 文体 学 (corpus stylistics) 、 基 于 语料库 的 翻译 共 
性 (translation universals) 和 译 者 文体 (translator”s style) 研 究 结 合 起 来 对 翻译 文 
本 进行 考察 ,拓展 语料库 翻译 研究 的 视角 ,探索 翻译 的 本 质 。 
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14.2 文体 的 定义 及 文体 学 的 研究 范围 


Leech & Short(1981/2001:10) ,将 文体 (style) 定 义 为 “特定 语 境 下 ,特定 人 物 
出 于 特定 目的 对 语言 的 使 用 方式 ”, 他 们 (同上 : 38-39) 对 这 一 概念 做 了 进一步 说 
明 :1) 文 体 是 语言 的 使 用 方式 :2) 文 体 属于 言语 而 不 是 语言 的 范畴 ;3) 文 体 是 由 从 
语言 总 存 (repertoire) 中 所 做 的 各 种 选择 组 成 ;4) 对 文体 的 定义 是 根据 语言 使 用 域 
(domain) 来 进行 的 (如 特定 作者 在 特定 文 类 或 特定 文本 中 会 做 出 何 种 选择 ) 。 根 据 
Crystal(1999:323) ,文体 是 个 体 或 群体 在 一 定 情境 中 对 语言 的 独特 使 用 。Wales 
(2001:371) 将 文体 定义 为 “可 察觉 的 独特 表达 方式 ”。 这 里 需要 指出 的 是 英语 
style 一 词 并 不 仅 指 汉语 中 的 “文体 ”, 有 时 它 还 被 用 来 指 “ 语 体 、 风 格 ” 等 。 文 体 实 
际 上 是 一 个 较为 宽泛 的 概念 ,研究 者 因为 研究 角度 的 差异 常常 偏重 其 不 同 的 部 分 ， 
如 体裁 . 语 体 等 研究 。 程 十 民 (1989:1-2) 将 语 体 定义 为 “同一 语言 品种 (标准 语 \ 方 
言 , 社 会 方言 等 ) 的 使 用 者 在 不 同 的 场合 中 所 典型 地 使 用 的 该 语言 品种 的 变 体 ”。 
他 (同上 :46) 进 一 步 指出 :“ 语 体 的 实质 是 一 些 在 使 用 场合 上 有 区 别 的 同一 变 体 的 
选择 ?陈国华 (1997:48) 指 出 “文体 和 语 体 是 两 个 范畴 ,前 者 主要 指 书面 语言 的 体 
裁 形 式 ,包括 散文 体 , 诗 歌 体 , 书 信 体 ,等 等 ;后 者 指 一 种 语言 的 各 种 变 体 ,包括 书面 
语 ` 口 语 , 地 域 方言 ,社会 方言 个 人 特色 语 (idiolect) ,等 等 ”总体 上 ,文体 研究 因为 
视角 不 同一 般 包 括 文体 类 型 (genre)、 语 言 变 体 (linguistic variety) 和 文本 类 型 
(text type) 三 个 方面 的 研究 。 

Genre 一 词 源 自 拉 丁 语 genus, AEH Ph A”. WMA Crystal(1999; 132), genre 
指 艺 术 作品 可 识别 的 范畴 ,在 文学 领域 中 可 包括 诗歌 戏剧、 小 说 等 一 般 概念 ,以 及 
科幻 小 说 ,犯罪 小 说 和 浪漫 小 说 等 次 类 概念 ;用 于 抽象 义 时 可 以 指 口语 或 书面 语 中 
任何 可 区 分 的 变 体 ,如 歌曲 ,布道 或 对 话 。 本 章 根据 前 一 种 释义 将 genre 译 成 “ 文 
体 类 型 ”, 简 称 “ 文 类 ”。 这 一 类 别 是 从 文学 研究 的 视角 出 发 ,按照 语言 表现 形式 从 
宏观 上 将 文本 划分 为 文学 和 非 文学 两 个 范畴 ,前 者 包括 诗歌 .小 说 .散文 ,戏剧 等 ， 
后 者 则 包括 政论 ,传记 ,新 闻 等 。 语 言 变 体 是 社会 语言 学 术语 ,也 称 为 语言 变异 或 
语言 异体 ,Hudson(1996/2000:22) 将 其 定义 为 “有 相似 社会 分 布 的 一 套 语 项 *。 这 
里 “相似 社会 分 布 " 是 指 相同 的 社会 环境 或 具有 相同 社会 特征 的 语言 使 用 者 。 语 言 
变 体 可 能 与 一 种 语言 中 的 发 音 、 语 法 或 词汇 选择 等 因素 有 关 , 也 可 能 与 语言 使 用 者 
的 社会 地 位 以 及 教育 程度 等 社会 因素 有 关 , 还 可 能 受 社会 语 境 或 使 用 场合 的 正式 
程度 制约 。 语 言 变 体 常 被 笼统 称 为 语 体 ,实际 包括 使 用 变 体 (use-related variety) 
和 使 用 者 变 体 (user-related variety) 两 个 方面 ,根据 语言 的 使 用 可 将 语言 变 体 划分 
为 语 体 和 语 域 两 个 方面 ,前 者 是 根据 语言 使 用 场合 的 正式 程度 ,后 者 则 与 社会 语 
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境 , 如 职业 ,主题 ,谈话 对 象 等 因素 有 关 。 

Trudgill(1983:102) 指 出 ,原则 上 语 体 和 语 域 是 独立 的 ,例如 足球 语 域 可 与 正 
式 语 体 共 现 (如 高 级 报纸 的 报道 中 ) ,或 与 非 正式 语 体 共 现 (如 酒吧 里 的 谈话 中 ) ,但 
许多 时 候 两 者 往往 是 联系 在 一 起 的 。 根 据 使 用 者 划分 的 语言 变 体 称 为 方言 ,具体 
包括 地 域 方言 .时代 方言 ,社会 方言 ,标准 语 和 个 人 特色 语 等 。 以 上 这 些 均 可 作为 
语言 变 体 研究 的 对 象 。 此 类 别 是 从 语言 学 视角 ,从 微观 上 按照 语言 的 使 用 情境 或 
正式 (或 礼貌 ) 程 度 所 进行 的 分 类 。 根 据 Hatim & Mason(1990/2001:140) ,文本 
类 型 作为 一 个 概念 框架 可 以 帮助 我 们 按照 服务 于 总 体 修辞 目的 的 各 种 交际 意图 来 
对 文本 进行 划分 ,这 些 意图 至 少 包 括 四 个 方面 :1) 引 起 读者 的 注意 ;2) 宣 布 某 一 话 
题 ;3) 表 达 对 某 项 计划 的 支持 ;4) 通 过 论证 说 理 。 据 此 , Hatim & Mason(1990/ 
2001:153-158) 将 文本 划分 为 论说 性 、 说 明 性 和 指导 性 三 大 类 。 但 需要 指出 的 是 ， 
这 里 文本 类 型 的 划分 与 文体 类 型 划分 在 有 些 方面 存在 部 分 重合 ,如 广告 从 文本 类 
型 上 属于 指导 文 的 范畴 ,从 文体 类 型 上 则 属于 非 文学 文本 的 范畴 ,电影 字幕 从 文本 
类 型 上 属于 氢 述 文 的 范畴 ,从 文体 类 型 上 则 属于 文学 文本 的 范畴 。 

Trosborg(1997:16) 指 出 ,文体 类 型 和 文本 类 型 的 划分 理论 基础 不 同 ,但 两 者 
都 是 有 效 的 文本 契约 ,对 前 者 的 定义 和 划分 是 以 系统 的 非 语 言 学 标准 为 基础 ,而 后 
者 则 是 以 认 知 范畴 或 严格 的 语言 学 标准 为 基础 。 文 本 类 型 有 时 也 被 笼统 称 为 文 
体 ,从 写作 修辞 的 视角 ,按照 信息 呈现 方式 可 将 文本 划分 为 叙述 ,描写 .说 明 、 论 说 
和 指导 五 个 类 型 。 

Bally 认为 ,语言 除 客观 表达 思想 外 , 常 带 有 各 种 情感 色彩 ,文体 学 的 任务 在 于 
探讨 表达 不 同情 感 特征 的 各 种 语言 手段 以 及 它们 之 间 的 相互 关系 ,并 由 此 入 手 分 
析 语 言 的 整个 表达 方式 系统 ( 申 丹 ,2000:22) 。 申 丹 (2008: V ) 指 出 :“ 文 体 学 是 运 
用 现代 语言 学 理论 和 方法 来 研究 文体 的 学 科 , 在 某 种 意义 上 , 它 与 语言 学 之 间 的 关 
系 是 一 种 极为 密切 的 寄生 关系 ,新 的 语言 学 理论 的 乘 胜 和 发 展 往往 会 催生 新 的 文 
体 学 分 支 。" 文 体 学 的 地 勃 发 展 也 同样 为 翻译 研究 者 提供 新 的 研究 视角 ,重新 来 审 
视 与 翻译 活动 相关 的 文体 现象 。 对 文体 与 翻译 的 讨论 主要 分 为 原作 取向 型 
(source-text oriented) 和 译作 取向 型 两 类 。 


14.3 ”翻译 研究 的 文体 学 视角 


14.3.1 原作 取向 型 


原作 取向 型 的 翻译 文体 学 研究 主要 包括 两 类 :第 一 ,从 语文 修辞 角度 探讨 译文 
与 原作 在 语文 上 的 对 应 关系 ,代表 人 物 如 Tytler(1907/2007) 等 。 第 二 ,从 语言 学 
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角度 探讨 译文 与 原作 在 形式 上 的 对 应 关系 ,代表 人 物 如 Nida & Taber(1969) 等 。 

Tytler(1907/2007:9) 早 在 18 世纪 末 就 明确 提出 ,好 的 译文 “写作 文体 和 风格 
应 当 与 原作 的 特点 相同 ”, 并 且 * 译 文 应 当 具有 原作 的 自如 ”。 这 里 所 说 的 文体 和 风 
格 主要 指 原作 的 语文 和 修辞 ,也 就 是 说 ,译文 应 当 以 源 文本 的 语文 和 修辞 为 核心 。 
Tytler( 同 上 :63-64) 指 出 ,好 的 译 者 应 当 发 现 原作 者 文体 的 真正 特点 ,确认 其 属于 
哪 一 类 别 , 是 严肃 体 、 高 尚 体 、 随 意 体 、 活 泼 体 、 华 丽 体 还 是 简单 体 ,并 将 原作 的 这 些 
特点 在 译文 中 加 以 明确 体现 。 可 见 ,Tytler 所 讨论 的 “文体 ”实际 上 是 “ 语 体 ”问题 ， 
即 语言 的 正式 程度 (degree of formality) 。 

Nida & Taber(1969:12) 指 出 ,翻译 的 本 质 是 “在 接受 语 中 重新 创造 源 语言 信 
息 最 贴近 、 最 自然 的 对 应 项 ,首先 是 意义 ,其 次 是 文体 "。 根 据 Nida & Taber( 同 
上 :13-14》, 他 们 所 说 的 文体 不 仅 包括 :1) 文 体 类 型 ,如 诗歌 (poetry》、 散 文 (prose) 
等 形式 ;2) 文 本 类 型 或 写作 修辞 模式 ,如 叙述 体 (narrative)、 说 明 体 (expository)、 
论说 体 (argumentative) 等 ;3) 语 体 , 如 (圣经 。 马 可 福音 》(Mark) 的 轻快 活泼 体 、 
《圣经 ， 路 迦 福 音 Luke) 的 优雅 体 等 ;4) 修 辞 ,如 该 谐 双关 语 (play on words) 等 。 
Nida & Taber( 同 上 ) 认 为 ,翻译 中 无 论 在 意义 还 是 文体 层面 ,功能 对 等 都 是 最 重 
要 的 。 


14.3.2 译作 取向 型 


译作 取向 型 的 翻译 文体 学 研究 主要 包括 两 类 :第 一 , 令 事 学 视角 的 文体 翻译 研 
究 , 代 表 研究 如 Hermans(1996 , 2002) , Bosseaux(2004) , Millán-Varela (2004) 4; 
第 二 ,语言 学 视角 的 文体 翻译 研究 , 代表 人 物 如 Baker (2000) ; Olohan (2004), 
Marco(2004) ,Malmkjeer(2003 , 2004) 4, 

Hermans(1996:27) 提 出 ,翻译 叙事 话语 (translated narrative discourse) EX 
本 中 表现 出 的 声音 不 止 一 种 ,其 话语 呈现 方式 也 不 止 一 种 ,他 将 叙事 话语 中 包含 的 
“第 二 位 ”声音 称 为 译 者 的 声音 (translator’s voice), 以 此 作为 译 者 话语 呈现 的 表 
征 。Hermans(2002:11) 指 出 ,译作 当中 译 者 异 质 声音 的 痕迹 随处 可 循 ,译作 绝 非 
是 对 原作 的 透明 再 现 ,而 是 具有 多 重 、 分 散 、 混 杂 和 复 调 (polyphony) 人 性 质 的 双重 文 
本 , 旁 注 ,脚注 .括号 说 明 以 及 序言 等 准 文本 形式 无 不 表明 两 种 不 协调 的 声音 共存 于 
译作 中 ,因此 以 “透明 ?来 评价 译作 有 些 过 于 简单 。 这 些 研究 主要 是 从 翻译 策略 及 翻 
译 的 社会 表现 形式 探讨 译 者 特有 的 存在 方式 ,是 从 语言 外 部 来 观察 翻译 整体 表现 出 
的 特征 。Bosseaux(2004) 考 察 了 弗吉尼亚 。 伍 尔 夫 《到 灯塔 去 X(To the Lighthouse) 
及 其 三 个 法 文 译本 中 作为 视点 (point of view) 概 念 语言 学 表现 之 一 的 自由 间接 引 
W Cree indirect speech) 的 翻译 。 从 叙事 学 视角 考察 了 译 者 的 话语 呈现 方式 ,探讨 
了 译 者 的 选择 会 对 叙事 结构 的 转换 产生 何 种 影响 。Mill4n-Varela《2004) 利 用 巴赫 
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金 的 对 话 理论 (dialogism) 和 话语 混杂 (heteroglossia) 等 概念 集中 关注 了 和 詹姆斯。 
乔 伊 斯 作品 的 加 利 西亚 语 (Galician) 翻 译 ,讨论 了 译 者 的 声音 是 如 何 与 源 文 本 中 其 
他 声音 相互 作用 ,以 及 译 者 的 声音 有 何 种 塑造 功能 。Millén-Varela(2004:52) 在 结 
论 中 指出 ,对 翻译 文本 的 语言 学 和 文体 学 分 析 可 以 为 研究 者 提供 关于 翻译 主体 及 
其 意识 与 动机 的 关键 性 信息 。 

语料库 翻译 研究 模式 在 此 领域 的 应 用 将 译 者 以 语言 和 非 语言 形式 所 表现 出 的 
风格 均 作为 研究 对 象 ,扩大 了 文体 研究 的 范围 。Baker(2000:245) 指 出 , 译 者 文体 
包括 译 者 的 选材 ,惯用 的 具体 策略 ,包括 前 言 . 后 记 、 脚 注 ,文中 词汇 注释 等 ,尤为 重 
要 的 是 个 性 的 表达 方式 , 即 典 型 的 语言 运用 习惯 。 可 见 , Baker 所 谓 的 译 者 文体 是 
一 个 较为 宽泛 的 概念 ,而 且 这 些 特征 是 译 者 在 翻译 过 程 中 的 无 意识 产物 ,并 且 在 一 
定时 间 范 国内 保持 相对 稳定 。Baker(2000) 利 用 类 符 - 形 符 比 .平均 名 长 以 及 词 项 
say 的 使 用 ,对 比 了 Peter Bush $ Peter Clark 两 位 译 者 的 译文 后 得 出 结论 :既然 从 
理论 上 识别 某 个 文学 译 者 的 文体 是 可 能 的 ,就 有 可 能 借助 此 类 描写 来 描绘 该 译 者 
选择 再 现 的 世界 ,帮助 研究 者 将 语言 习惯 与 译 者 的 社会 文化 处 境 ( 包 括 文化 之 间 的 
关系 ,预期 读者 等 ) 结 合 起 来 。Olohan(2004:153-167) 通 过 “个 体 译 者 的 缩 略 词 模 
式 调查 ”和 “应 用 关键 词 分 析 探 究 译 者 的 词汇 选择 ”两 个 个 案 介 绍 了 译 者 文体 研究 
的 具体 操作 ,她 同时 指出 ,影响 译 者 文体 的 因素 包括 文化 中 介 的 需要 、 读 者 的 期 望 、 
意识 形态 以 及 编辑 与 修改 等 。Marco(2004:74) 从 Leech & Short(1981) 对 “文体 ” 
的 定义 人 手 强调 ,文体 并 非 仅 是 个 体 性 的 ,也 可 以 是 集体 性 的 , 即 特 定 文 类 或 特定 
话语 中 标准 化 了 的 语言 使 用 方式 ,也 就 是 说 ,文体 是 由 某 一 个 体 作 者 、 某 一 特定 作 
品 等 所 做 出 的 一 整套 (常常 是 模式 化 的 ) 语 言 学 选择 。Marco 给 出 了 一 个 建立 在 系 
统 功能 语法 基础 上 的 译文 导向 型 文体 分 析 模 式 (a model for translation-oriented 
stylistic analysis) ,从 原作 文体 对 译作 的 影响 和 译作 文体 的 语言 学 表现 两 个 互补 的 
视角 讨论 了 文体 与 翻译 的 关系 ,具体 包括 原作 文体 特征 ,以 及 个 体 或 群体 译 者 的 文 
体 特征 如 何在 译作 中 分 别 得 以 体现 两 方面 。Marco( 同 上 :89) 最 后 指出 ,文体 与 番 
译 界面 尚 有 很 多 值得 研究 的 问题 ,未 来 的 实证 研究 应 当 解 决 如 何 对 翻译 文本 中 的 
问题 模式 加 以 分 析 , 以 及 原作 文体 与 以 下 因素 的 相互 关系 ,这 些 因素 包括 : 译 者 的 
个 人 偏好 、 两 种 语言 的 对 比 、 目 标语 文学 系统 或 特定 群体 或 社会 运动 在 诗 学 和 意识 
形态 方面 的 要 求 等 ,基于 语料库 的 方法 论 在 此 领域 大 有 所 为 。Malmkjaer (2003， 
2004) 以 H. W. Dulcken 对 安徒生 作品 的 英 译 为 例 对 译 者 文体 作 了 进一步 探索 ， 
初步 提出 了 “翻译 文体 学 ”(translational stylistics) 这 一 概念 ， 主要 关注 在 原 语文 本 
既定 的 条 件 下 , 译 者 为 什么 会 以 特定 的 方式 来 塑造 译文 ,对 这 些 现象 的 解释 除 考虑 
语言 因素 外 , 亦 可 从 语言 外 因素 人 手 ,如 翻译 规范 、 译 语文 本 的 目的 等 。 
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14.4 ”基于 语料库 的 翻译 文体 学 研究 框架 


近年 来 语料库 方法 开始 广泛 应 用 于 文体 学 研究 和 翻译 研究 ,其 中 语料库 文体 
学 (corpus stylistics) 的 一 些 研究 成 果 开 始 引 起 学 者 们 的 关注 (Semino & Short 
2004; Wynne 2005; Hoover 2007 等 ), 国 内 外 学 者 所 进行 的 基于 语料库 的 翻译 共性 
和 译 者 文体 研究 均 可 视 为 翻译 文体 研究 的 一 个 方面 , 却 未 能 就 翻译 研究 中 的 各 种 
文体 现象 建立 起 一 套 统一 的 基于 语料库 的 翻译 文体 学 研究 框架 。 基 于 语料库 的 翻 
译文 体 学 是 以 双语 平行 语料库 为 基础 的 描写 研究 ,采用 语 际 对 比 和 语 内 类 比 相 结 
合 的 综合 对 比 的 模式 ,通过 计算 机 软件 对 各 类 文本 (包括 从 文体 类 型 .语言 变 体 和 
文本 类 型 角度 分 类 的 文本 ) 的 文体 特征 进行 语言 学 的 量化 描写 ,在 充分 描写 和 分 析 
的 基础 上 从 语言 内 、 外 加 以 解释 。 

在 翻译 共性 和 译 者 文体 研究 的 基础 上 ,翻译 文体 学 研究 的 内 容 可 包括 两 大 类 ; 
1) 语 际 对 比 文体 (contrastive style) , 即 原文 文体 对 译文 的 影响 及 其 在 译文 中 的 表 
现 ;2) 语 内 类 比 文体 (comparable style), 是 指 翻译 文本 与 目标 语 中 具有 类 比 关系 
(包括 文体 类 型 文本 类 型 . 语 域 .时 代 等 ) 的 非 翻 译文 本 相 比 较 ,翻译 文本 整体 上 所 
表现 出 文体 特征 ,具体 又 可 分 为 三 种 :第 一 ,目标 语 中 特定 时 期 翻译 文本 与 非 翻 译 
文本 的 文体 对 比 ; 第 二 ,特定 译 者 的 翻译 文本 与 其 创作 的 非 翻 译文 本 之 间 的 文体 对 
比 ;第 三 , 译 出 与 译 人 翻译 文本 的 文体 对 比 。 这 些 研究 可 以 帮助 翻译 研究 者 认识 到 
翻译 文本 不 同 于 一 般 文本 的 具体 特征 及 其 产生 原因 ,有 利于 我 们 进一步 从 文体 视 
角 认 识 翻译 的 本 质 。 

翻译 文体 学 研究 的 描写 参数 可 分 为 语言 形式 参数 和 文学 叙事 参数 (多 限于 文 
学 作品 ,尤其 是 小 说 文本 ) 两 大 类 。 

第 一 ,语言 形式 参数 ,具体 包括 平均 句 长 (average sentence length), PHK 
标准 差 (standard deviation of sentence length) ,类 符 - 形 符 比 (type-token ratio) AK 
准 化 类 符 - 形 符 比 (standardized type-token) .词汇 密度 (lexical density) 关键 词 
(keyword) 等 ,这 些 数据 均 可 通过 WordSmith 工具 获得 。 不 同类 型 文本 的 平均 句 
长 不 同 ,根据 平均 名 长 和 平均 名 长 标准 差 就 可 以 了 解 文 本 中 各 种 长 短 句子 的 分 布 
情况 。 类 符 - 形 符 比 指 语料库 中 连续 词语 (running words) 总 数量 与 所 使 用 不 同 词 
请 数量 之 间 的 比值 。 类 符 - 形 符 比 取决 于 语料库 的 大 小 ,根据 Wordsmith Tools 提 
供 了 一 个 标准 化 类 符 - 形 符 比 ,可 对 不 同 长 度 文本 或 语料库 的 类 符 - 形 符 比 进行 比 
较 , 做 出 关于 其 使 用 词语 多 样 性 程度 的 论断 (Olohan 2004 ; 80-81) 。 词 汇 密度 是 用 
来 描写 语料库 中 词汇 词 与 语法 词 关系 的 比率 , 即 词汇 词 占 总 词 数 的 百分比 。 根 据 
斯 塔 波 (1996), 大 多 数 书面 语文 本 的 词汇 密度 超过 40% ,而 口语 文本 的 词汇 密度 
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变化 幅度 较 大 ,书面 语文 本 之 间 也 存在 差异 ,这 通常 与 文体 类 型 相关 ,文学 文本 的 词 
汇 密度 要 比 学 术 文章 等 非 文 学 文本 低 ,表现 出 的 趋势 是 信息 负载 逐渐 增高 (同上 : 
81) 。 词 汇 密度 常 被 作为 计量 简化 (simplification) 的 一 种 手段 (如 Laviosa 1998a, 
1998b)。Olohan《2004:81) 指 出 ,不 同类 型 或 不 同 语 域 文本 组 成 的 两 个 不 同 语料库 
的 频次 表 , 在 文本 类 型 或 语 域 方面 的 差异 会 在 一 些 词汇 词 或 语法 项 的 频次 差异 上 
有 所 体现 ,利用 软件 来 比较 两 个 语料库 的 频次 表 , 就 可 以 识别 出 较 两 个 语料库 的 关 
键 词 。 通 过 以 上 这 些 参数 就 可 以 发 现 源 文本 与 目标 语文 本 、 目 标语 翻译 文本 与 非 
翻译 文本 之 间 在 词汇 多 样 性 ,信息 负载 .主题 焦点 化 和 创造 性 词汇 使 用 方面 的 差 
异 , 并 对 这 些 差异 进行 量化 ,认识 翻译 文本 的 文体 特征 。 

第 二 ,文学 叙事 参数 ,如 从 两 个 被 比较 文本 中 对 人 称 代词 和 自由 间接 引 语 的 使 
用 来 考察 译 者 的 选择 会 对 叙事 结构 转换 产生 何 种 影响 ,以 及 翻译 文本 的 叙事 结构 
与 非 翻 译文 本 有 何不 同 。 

可 见 , 借 助 语料库 工具 的 翻译 文体 学 研究 主要 有 三 个 特征 :第 一 ,从 翻译 文本 
人 手 , 将 翻译 文本 作为 独立 整体 加 以 分 析 ; 第 二 , 主要 从 翻译 语言 中 来 发 现 译 者 和 
翻译 过 程 留 下 的 痕迹 ;第 三 ,不 再 将 源 文本 -目标 文本 之 间 “ 对 等 ”与 否 作为 衡量 译 
文 的 文体 标准 ,而 是 作为 参照 文本 来 探讨 源 文本 因素 对 目标 文本 的 影响 。 


14.5 小 结 


翻译 文体 学 研究 是 通过 语言 对 比 这 一 纽带 将 文体 学 与 翻译 研究 结合 起 来 , 改 
变 了 翻译 研究 仅仅 关注 语言 转换 或 文化 研究 的 单一 模式 局 面 ,而 是 在 双语 语料库 
基础 上 将 语言 对 比 \ 文 体 学 研究 与 翻译 研究 结合 起 来 ,拓宽 翻译 研究 的 视野 。 将 文 
体 学 研究 对 象 的 范围 扩大 到 翻译 文本 , 即 以 翻译 文本 为 基础 ,从 文体 学 的 视角 探究 
翻译 文本 所 表现 出 各 类 特征 的 根源 。 目 前 ,翻译 文体 学 研究 尚 处 于 探索 阶段 , 进 一 
步 的 研究 还 需要 建立 系统 的 翻译 文体 学 检测 项 ,制定 一 套 针对 翻译 文体 行 之 有 效 
的 语料库 标注 符 集 , 从 而 对 翻译 文体 进行 更 为 客观 的 描写 和 解释 。 


第 3 部 分 
语料库 与 翻译 教学 


第 15 章 


语料库 翻译 教学 的 理论 与 原则 


本 章 分 析 了 对 应 语料库 、 翻 译 教学 和 自主 学 习 之 间 的 内 在 联系 ,在 此 基础 上 探 
讨 汉 英 对 应 语料库 在 翻译 教学 中 应 用 的 原则 和 方式 。 研 究 认为 ,对 应 语料库 可 以 
为 自主 学 习 和 发 现 式 学 习 创建 有 利 的 实施 环境 ,而 自主 学 习 和 发 现 式 学 习 有 助 于 
翻译 教学 效果 的 提高 ,这 是 对 应 语料库 应 用 于 翻译 教学 的 理论 依据 。 基 于 此 ,对 应 
语料库 在 翻译 教学 中 运用 的 基本 原则 是 观察 先 于 归纳 .呈现 先 于 讲解 .学 生 自 导 先 
于 教师 指导 。 


15.1 引言 


现代 语料库 是 基于 当代 信息 技术 的 真实 语言 材料 处 理 、 存 储 和 检索 系统 。 近 
20 年 来 ,基于 语料库 的 语言 研究 取得 了 长 足 发 展 ,与 之 相关 的 语言 研究 方法 也 得 
到 了 学 界 的 广泛 认同 。 对 应 语料库 起 步 较 晚 , 大 都 在 20 世纪 90 年 代 初 期 开始 创 
建 ,但 已 展现 出 良好 的 发 展 和 应 用 前 景 。 在 欧美 ,这 类 语料库 有 十 多 个 ,涉及 十 多 
个 欧洲 语种 , 较 著 名 的 有 Hansard( 法 - 英 对 应 语料库 ) .ENPC( 英 语 -挪威 语 对 应 语 
料 库 )(Veronis 2000:14-15); 在 中 国 , 已 初 具 规模 县 拥有 自主 研发 检索 系统 的 对 应 
语料库 是 北京 外 国语 大 学 “ 汉 英 对 应 语料库 ”( 王 克 非 2004a; 该 库 现 有 可 检索 语 料 
2000 万 字 / 词 ), 也 是 本 课题 研究 的 一 个 主要 平台 。 语 料 库 的 创建 有 两 个 主要 用 
途 :一 是 用 于 语言 研究 ,二 是 用 于 外 语 教 学 。 与 前 者 相关 的 研究 内 容 丰 富 , 涉 及 语 
言 对比、 双语 辞典 编纂 和 翻译 研究 (Baker 1995,1999;Gaussier et al. 2000;Serpellet 
2000; Hunston 2002 等 )。 而 第 二 个 方面 的 研究 尚 不 充分 , 且 大 都 基于 单 语 或 学 习 
者 语料库 (如 Sinclair 1996; Wichmann 1997; Hunston 2002 等 )。 

将 对 应 语料库 应 用 于 翻译 教学 的 研究 刚刚 起 步 (Bowker 2003; Bernardini 
2004b) 。 近 年 来 ,国内 已 有 研究 关注 语料库 在 翻译 教学 中 的 应 用 ( 柯 飞 2002a， 
2002b; 郭 红 2004; 于 连 江 2004; 王 克 非 2004a, 2004b 等 ), 但 这 些 研 究 还 没有 解决 
平行 语料库 与 微观 翻译 教学 环节 的 衔接 问题 。 主 要 原因 有 :从 创建 目的 上 看 ,对 应 
语料库 主要 服务 于 语言 对 比 辞 典 编纂 和 翻译 研究 ,而 非 外 语 教学 ;从 创建 技术 上 
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讲 , 目 前 常见 的 对 应 语料库 多 为 词性 标注 ,这 就 影响 着 语言 信息 的 提取 深度 ,还 无 
法 同时 提供 翻译 所 需 的 语义 -句法 信息 ;从 检索 技术 上 说 ,语料库 使 用 者 很 难 一 次 
检索 到 适合 课堂 使 用 的 语言 材料 。 总 之 ,关于 对 应 语料库 在 翻译 教学 中 的 应 用 在 
语 料 处 理 , 检 索 方 法 以 及 与 翻译 课 授课 内 容 的 结合 上 还 有 很 多 问题 有 待 解决 。 本 
章 的 主要 内 容 是 : 汉 英 对 应 语料库 在 翻译 教学 中 应 用 的 理论 依据 ; 汉 英 对 应 语料库 
在 翻译 课堂 教学 中 应 用 的 原则 ; 汉 英 对 应 语料库 在 翻译 教学 中 运用 的 主要 方式 。 


15.2 ”对 应 语料库 在 翻译 课堂 教学 中 应 用 的 理论 依据 


根据 目前 的 研究 ,对 应 语料库 在 翻译 中 的 应 用 价值 主要 体现 在 以 下 几 个 方面 : 
1) 语 料 库 可 用 来 提高 一 般 意义 上 的 语言 意识 (Hunston 2002:123), 即 译 者 对 两 种 
语言 的 驾驭 能 力 , 所 以 在 翻译 培训 和 集中 探讨 某 些 翻译 技巧 问题 时 非常 有 用 ;2) 通 
过 对 比 语 篇 观察 两 种 语言 是 以 何 种 方式 来 编码 对 应 意义 的 (Barlow 2000:111); 
3) 可 使 用 双语 语料库 数据 分 析 为 译 者 提供 不 同 语言 中 可 能 的 翻译 单位 或 者 对 等 篇 
章 单位 的 集合 ,提高 译 者 的 翻译 意识 , 即 对 翻译 难点 的 处 理 意识 (awareness) 和 对 
翻译 策略 的 运用 意识 ,有 助 于 改进 翻译 的 终端 产品 (Serpellet 2002:359-360) ;4) X 
语 语料库 还 有 助 于 翻译 对 等 的 研究 (Leech 1997 :22) ,帮助 研究 者 洞悉 翻译 的 本 质 
(Hunston 2002:128) 。 

以 上 论述 虽 未 谈 及 翻译 课堂 教学 ,但 对 应 语料库 对 于 翻译 学 习 者 和 翻译 从 业 
者 的 辅助 作用 是 相似 的 ,只 是 作用 的 方式 和 程度 有 别 。Barlow 较 早 探讨 对 应 语 料 
库 在 课堂 教学 中 的 应 用 。 他 指出 ,在 课堂 上 使 用 对 应 语料库 能 使 语言 学 习 者 直接 
探究 (可 能 是 应 老师 的 要 求 ) 两 种 语言 中 词 和 结构 的 主要 对 应 项 ,帮助 学 生 在 面 对 
这 些 信息 的 情况 下 建立 新 的 图 式 并 构建 恰当 的 图 式 -意义 关联 (Barlow 2000:113) 。 
而 Bernardini(2004a,2004b) 的 研究 表明 ,对 应 语料库 的 使 用 有 助 于 发 现 式 学 习 环 
境 的 创建 。 

我 们 认为 ,将 对 应 语料库 应 用 于 翻译 教学 有 利于 创造 自主 学 习 (autonomous 
learning) 的 环境 ,是 自主 学 习 理论 的 自然 延伸 。 正 像 对 应 语料库 在 翻译 研究 和 翻 
译 实践 中 具有 重要 价值 ,对 应 语料库 在 翻译 教学 中 也 起 着 重要 作用 ,有 助 于 翻译 教 
学 和 技能 培养 水 平 的 提高 。 


15.2.1 语料库 与 自主 学 习 


学 习 自 主 性 就 是 学 生 负 责 自己 学 习 的 能 力 , 这 一 理念 通常 被 认为 是 推行 自 导 
式 学 习 (self-directed learning) 的 结果 。 自 主 学 习 这 一 理念 出 现在 20 世纪 60 年 
代 , 时 间 不 短 , 但 它 具 体 指 什么 ,现在 还 没有 完全 一 致 的 看 法 。 
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一 种 看 法 是 完全 自主 , 即 自主 学 习 和 课堂 学 习 无 关 。 目 标 、 进 度 和 学 习 效 果 的 
评估 完全 由 学 习 者 自己 确定 (Benson 2001:8), 由 学 习 者 自己 负责 与 学 习 相 关 的 决 
策 并 实施 这 些 决策 (Dickinson 1987:11) 。 

另 一 种 看 法 是 自主 学 习 可 以 在 课堂 教学 环境 下 实施 , 即 改 变 传 统 教学 的 基本 
架构 ,将 教学 过 程 的 控制 权 从 教师 移交 给 学 生 。 目 前 的 研究 显示 ,培养 学 习 者 的 反 
思 和 分 析 能 力 是 提高 学 习 自主 性 的 核心 ,而 这 一 能 力 的 发 展 有 赖 于 学 习 者 全 心 投 
人 到 人 际 互动 中 去 (Benson 2001:14)。 依 照 这 种 学 习 观 , 那 种 将 自主 视 为 纯 个 体 
学 习 行为 的 观念 需要 纠正 ,自主 学 习 并 非 只 是 课堂 教学 之 外 的 学 习 活动 。 即 使 在 
传统 教学 模式 下 的 课堂 里 ,只 要 有 合适 的 合作 和 互动 环境 ,也 同样 有 利于 学 生发 展 
自主 学 习 能 力 ,实现 预期 的 教学 目标 。 

如 果 我 们 同意 后 一 种 自主 性 学 习 观 ,对 应 语料库 就 可 以 成 为 翻译 课堂 教学 中 
自主 学 习 实施 的 理想 平台 。 从 技术 上 讲 , 语 料 库 可 为 学 习 者 快速 提取 学 习 材 料 提 
供 方便 ;从 内 容 看 ,适当 规模 的 语料库 可 为 学 习 者 提供 丰富 多 样 的 例证 。 

较 之 传统 的 翻译 教学 模式 ,语料库 支持 下 的 翻译 教学 更 易于 加 强 学 习 者 学 习 的 
主动 性 和 自主 性 ,因为 这 时 学 习 者 可 以 是 发 现 者 ,甚至 是 研究 者 。 如 果 把 学 习 者 视 
为 发 现 者 ,就 应 该 引导 学 习 者 去 观察 和 探寻 外 国语 言 现 象 ,就 像 语言 学 家 以 同样 的 
方式 去 发 现 此 前 未 曾 注意 的 本 族 语 语言 事实 (Bernardini 2004a; 23; 2004b; 102); 
如 果 把 学 习 者 视 为 研究 者 ,就 应 鼓励 学 生 按 照 自己 的 选择 去 获得 、 组 织 并 研究 真实 
语言 素材 。 这 就 为 学 生 作为 “研究 者 ”去 开辟 新 的 研究 领域 带 来 了 实 实 在 在 的 希望 
(Leech 1997:10). 

本 章 更 倾向 于 将 学 习 者 视 为 发 现 者 。 鉴 于 翻译 教学 的 经 验 性 和 实践 性 特征 ， 
对 应 语料库 为 翻译 教学 提供 了 一 种 自主 学 习 环境 ,学 生 可 以 从 中 发 现 母 语 和 外 语 
各 自 的 特征 以 及 转换 的 方式 ,培养 起 翻译 意识 ,逐渐 形成 运用 翻译 策略 的 能 力 。 具 
体 说 来 ,通过 考察 一 个 词 或 者 一 个 结构 的 多 个 翻译 例证 ,个 别 性 的 因素 就 会 被 规律 
性 替代 ;而 这 些 由 学 习 者 自己 归纳 出 来 的 有 动因 的 翻译 策略 累积 起 来 ,就 可 使 学 
习 者 感知 到 有 效 的 ,具有 普遍 性 的 翻译 处 理 方式 ,并 形成 有 意义 的 概括 。 


15.2.2 ”翻译 教学 中 的 自主 学 习 


目前 有 研究 显示 ,自主 学 习 和 翻译 教学 在 理论 上 有 很 多 契合 点 。 

在 课程 设置 上 ,以 学 习 者 为 中 心 的 课程 设置 与 其 他 课程 设置 的 关键 差异 在 于 ， 
它 强调 教师 与 学 习 者 之 间 的 共同 努力 ,因为 学 习 者 与 涉及 课程 设置 的 内 容 和 教 法 
的 决策 过 程 是 紧密 相关 的 ( 李 德 凤 、 胡 枚 2006) 。 对 翻译 学 习 者 而 言 ,以 学 习 者 为 
中 心 是 学 习 者 通过 自主 学 习 逐 渐 成 为 翻译 工作 者 的 过 程 。 李 、 胡 进一步 指出 ,学 习 
者 学 习 翻 译 的 过 程 并 不 单 是 从 教师 那里 习 得 知识 ,而 是 在 实践 中 累积 建构 自己 的 
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专业 知识 ,教师 则 只 是 发 挥 指导 与 协调 的 作用 。 

在 实施 原则 上 , 王 宇 (2003) 指 出 ,所 谓 “ 以 学 习 者 为 中 心 ” 的 翻译 教学 , 指 的 是 
从 教学 目标 的 设 定 .教学 材料 的 选择 ,一 直到 课堂 教学 、 作 业 评估 等 环节 充分 考虑 - 
学 生 的 因素 。 具 体 表 现在 :1) 让 学 生 参 与 教学 内 容 和 翻译 材料 的 取舍 ;2) 组 织 有 效 
的 课堂 讨论 和 小 组 活动 以 激发 学 生 的 参与 意识 ;3) 教 学 方法 与 手段 应 侧重 于 培养 
学 生 严 谨 的 工作 作风 和 批判 性 思维 能 力 ,不 迷信 任何 参考 译文 或 译 者 ;4) 评 判 学 生 
译作 时 ,在 充分 肯定 其 闪光 点 后 ,注重 分 析 和 挖掘 误 译 或 错 译 的 原因 等 。 

以 上 研究 所 使 用 的 “以 学 习 者 为 中 心 的 翻译 课程 设置 ”是 一 种 教学 模式 ,与 这 
一 模式 相关 的 教学 设计 实际 上 是 围绕 自主 学 习 策略 进行 的 (Yang 2006)。 这 要 求 
在 翻译 课程 设置 上 应 考虑 学 习 者 的 自主 性 、 创 造 性 和 互动 性 ,协调 学 习 者 、 翻 译 教 
学 和 市 场 需求 之 间 的 关系 。 发 挥 学 习 者 的 自主 性 和 创造 性 实际 上 就 是 相信 并 充分 
运用 学 习 者 观察 ,发 现 ,分 析 和 制定 策略 解决 翻译 问题 的 能 力 。 互 动 性 主要 指 学 习 
者 之 间或 师 生 之 间 及 时 反馈 各 自 的 观点 和 发 现 ,并 通过 协作 和 商讨 来 解决 问题 。 


15.2.3 真实 语 料 与 翻译 教学 


对 应 语料库 存储 的 是 一 个 双语 或 多 语文 本 ,这 类 语料库 为 翻译 教学 提供 了 一 
个 理想 的 实施 平台 。 对 应 语料库 应 用 于 翻译 教学 的 优点 主要 体现 在 以 下 四 个 
方面 : 

第 一 ,与 传统 基于 直觉 的 分 析 相 比 ,基于 语料库 的 教学 有 助 于 学 生发 现 语 言 使 
用 的 复杂 性 和 语言 中 的 型 式 (pattern) (Barlow 2000:106) 。 

第 二 ,学 生花 些 时 间 审 读 真 实 篇 章 中 有 语 境 的 例证 ,这 样 要 比 完全 或 者 主要 依 
赖 语 法 书 和 教科 书 中 那些 孤零零 的 范例 更 可 取 ( 同 上 :106)。 

第 三 ,可 以 使 用 语料库 将 某 些 词 或 语法 特征 从 一 种 语言 里 挑 出 来 和 另 一 种 语 
言 里 的 对 应 项 进行 对 比 ,查找 异同 。 这 样 , 对 应 语料库 就 可 以 用 作 一 个 专门 的 参照 
系统 ,把 学 习 者 的 注意 力 转向 成 熟 译 者 或 专家 译 者 所 发 现 的 典型 问题 的 典型 (或 非 
典型 ) 处 理 方法 (McEnery & Oakes 1996:211) 。 

第 四 ,如 果 把 翻译 教学 看 作文 化 顺应 过 程 , 即 学 习 者 愿意 把 自己 作为 一 个 某 一 
语言 社团 的 成 员 , 并 按照 这 一 社团 所 共享 的 思维 \ 行 为 和 交际 模式 来 有 效 地 传递 信 
息 ,对 应 语料库 的 实用 性 就 更 为 突出 (Bernardini 2004a:20) 。 

总 之 ,对 应 语料库 (包括 翻译 语料库 ) 已 经 成 为 翻译 教学 的 重要 工具 (同上 ) 。 
按照 语 类 或 题材 分 类 存储 的 语料库 可 以 使 学 习 者 对 比 原 语 和 译 语 语言 、 原 语 和 译 
语 语 篇 ,甚至 是 两 种 语言 的 同类 语 篇 。 这 就 给 发 现 式 学 习 提供 了 丰富 多 样 的 学 习 
材料 和 材料 获取 渠道 ,满足 翻译 学 习 者 自主 学 习 的 需要 。 
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15.3 汉 英 对 应 语料库 与 教学 内 容 的 设计 


传统 翻译 教学 内 容 的 编排 是 以 结构 为 纲 , 大 都 从 词素 、 词 的 翻译 谈 起 ,然后 扩 
展 到 词组 ,句子 和 篇 章 层面 的 转译 上 ( 陈 定安 1995; 陈 宏 薇 2004; 张 培 基 1980 $), 
这 种 编排 的 优点 是 层次 分 明 , 编 排 条 理 , 也 易于 授课 时 使 用 ;缺点 是 教师 不 好 把 握 
授课 内 容 的 难 易 程 度 ( 只 能 假定 语言 单位 小 的 处 理 起 来 更 容易 些 , 但 这 仅仅 是 一 种 
假定 ,还 没有 人 能 证 明 词 或 者 词组 一 定 比 句子 更 容易 处 理 ) ,不 易 确 定 教授 内 容 是 
否 具有 普遍 性 ,更 不 便 提供 丰富 多 样 的 译文 。 总 之 ,这 样 的 翻译 教学 规定 性 更 强 ， 
不 便 有 效 培养 学 习 者 处 理 实际 翻译 问题 的 能 力 。 

基于 对 应 语料库 的 教学 内 容 可 以 按照 频率 原则 编排 。 对 应 语料库 可 以 帮助 教 
师 检索 出 有 关 某 一 语言 现象 的 常用 翻译 技巧 和 策略 ,频次 高 的 先 讲 , 低 的 后 讲 。 这 
样 可 以 引导 学 生 先 掌握 有 普遍 意义 的 技巧 ,在 此 基础 上 探究 和 掌握 频次 低 \ 但 难度 
更 大 要 求 更 高 的 翻译 手段 和 处 理 策略 。 另 外 ,虽然 英汉 翻译 和 汉 英 翻译 使 用 的 翻 
译 手 段 大 致 相似 ,但 各 种 翻译 手段 的 使 用 频率 也 会 因 目 的 语 不 同 而 不 同 。 这 时 ,就 
更 需要 语料库 支持 才能 确定 哪些 技巧 和 策略 应 为 优先 安排 的 教学 内 容 。 

使 用 语料库 可 以 集中 而 且 方便 地 展示 大 量 的 翻译 实例 和 素材 ,这 一 点 用 纸 介 
的 教材 也 可 以 做 到 ,但 很 不 经 济 , 无 法 灵活 掌握 呈现 语 料 的 量 。 


15.4 汉 英 对 应 语料库 运用 于 课堂 上 的 可 能 方式 


有 关 语料库 在 语言 学 习 过 程 中 的 应 用 研究 大 多 是 基于 单 语 语料库 。 近 年 来 ， 
已 有 研究 注意 到 语料库 在 翻译 教学 中 的 应 用 ( 封 一 函 2001; 柯 飞 2002a,2002b; 王 
克 非 2004a,2004b; 郭 红 2004; 于 连 江 2004 等 ) ,研究 涉及 的 理论 问题 和 可 能 的 应 
用 方式 都 有 很 高 的 参考 价值 ,但 大 规模 对 应 语料库 在 翻译 课堂 教学 中 究竟 如 何 使 
用 ,目前 还 没有 明确 .具体 的 实施 办 法 。 所 以 ,有 必要 为 此 提出 可 行 的 实施 思路 。 
本 章 认 为 ,基于 自主 学 习 原则 、 基 于 语料库 所 提供 的 检索 技术 支持 ,基于 翻译 教学 
的 实践 性 特征 ,对 应 语料库 在 翻译 课堂 教学 中 的 应 用 可 以 按照 下 列 步骤 来 实施 。 

第 一 , 语 料 呈现 一 一 刺激 :使 用 平行 语 料 将 语言 学 习 者 的 注意 力 集中 于 关键 
词 /结构 的 翻译 对 应 项 。 语 料 由 教师 挑选 ,应 学 生 要 求 检 索 , 或 学 生 自 行 检索 。 

第 二 ,学 生 浏 览 语 料 :通过 考察 语 料 ,学 生 自行 建立 新 的 形式 -意义 关联 。 

第 三 ,学 生 报 告 观察 心得 并 记录 自 认 为 有 意义 的 发 现 :通过 观察 语 料 可 以 经 验 
性 地 展示 (或 让 学 生 自 我 发 现 ) 两 种 语言 对 应 的 一 对 多 、 多 对 多 性 质 ,使 初学 者 建立 
起 语言 意识 识 和 翻译 技巧 意识 。 教 师 及 时 得 到 反馈 并 回应 反馈 。 
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第 四 ,事前 和 事后 测试 :检验 语 料 呈现 的 效果 和 学 生 对 语 料 的 敏感 程度 。 

第 五 ,教师 和 学 生 共 同 讨论 与 所 呈现 语 料 相 关 的 翻译 策略 。 

在 这 种 教学 环境 下 ,学 习 者 的 观察 结果 可 能 是 局 部 或 者 经 验 式 的 概括 ,但 这 一 
观察 结果 可 以 通过 新 的 证 据 来 检验 .修改 和 丰富 。 从 外 语 学 习 和 翻译 技巧 意识 上 
看 ,学 习 者 通过 观察 双语 对 应 语 料 可 对 搭配 、 语 义 偏向 和 语义 韵律 等 现象 更 加 人 敏 
感 ;翻译 技巧 和 策略 可 以 通过 学 生 间 和 师 生 间 互动 讨论 逐步 形成 ,这 有 助 于 学 生 形 
成 稳定 ,持久 和 灵活 的 翻译 策略 。 而 在 传统 课堂 环境 下 , 单 靠 教师 课堂 传授 翻译 技 
巧 很 难 做 到 这 一 点 。 


15.5 语料库 翻译 课堂 教学 对 资源 的 要 求 


15.5.1 语 料 和 软件 资源 


英语 单 语 语料库 (如 BNC) 可 作为 参照 库 , 用 于 检索 ,检验 并 确定 汉 英 翻译 中 
可 能 使 用 的 结构 和 词汇 用 法 是 否 合乎 目的 语 规范 ;其 他 网 络 资源 如 各 种 搜索 引擎 
都 可 以 充当 有 效 的 参考 资源 。 

双语 语料库 (如 * 汉 英 对 应 语料库 ”可 用 于 检索 对 译 索 引 , 提 取 课堂 教学 需要 
的 翻译 素材 ;该 语料库 主要 由 教师 控制 使 用 ,教师 可 以 根据 学 生 的 要 求 及 时 提供 内 
容 丰 富 的 对 译 索 引 。 学 生 可 以 通过 观察 丰富 和 多 样 的 对 译 语 料 来 讨论 ,归纳 并 总 
结 出 翻译 技巧 。 

翻译 记忆 系统 (如 Trados) 的 特点 是 不 直接 提供 翻译 ,而 是 根据 匹配 率 提供 词 
汇 、 词 组 和 句子 的 汉 英 参 考 对 译 (当然 还 可 以 是 日 语 、 德 语 \ 法 语 , 俄 语 .西班牙 等 语 
言 之 间 的 互 译 ) ,翻译 学 习 者 根据 系统 所 提供 的 对 译 语 料 调整 或 修改 自己 的 译文 ， 
这 也 是 给 学 生 提 供 自我 监测 和 反省 自己 翻译 行为 的 机 会 。 更 重要 的 是 ,该 系统 的 
优点 是 可 在 安装 在 计算 机 上 供 学 习 者 根据 自己 的 需要 随时 调用 ,也 可 以 安装 在 小 
服务 器 上 供 学 生 课外 自修 时 使 用 。 


15.5.2 多 媒体 教学 环境 


课堂 教学 使 用 计算 机 网 络 教室 进行 语料库 辅助 的 翻译 教学 有 以 下 优点 ， 

第 一 ,可 以 直接 进入 教师 专用 的 服务 器 获取 预先 设 定 的 部 分 教学 资源 。 主 要 
由 教师 根据 课程 进度 和 教学 计划 提供 有 针对 性 的 翻译 例证 ,学 生 可 根据 需要 自行 
决定 提取 和 观察 的 数量 。 

第 二 ,学 生 可 以 使 用 电脑 上 的 翻译 记忆 软件 来 为 翻译 提供 参考 资源 。 

第 三 ,学 生 可 以 通过 共享 程序 和 邮件 ,或 小 组 讨论 来 交流 翻译 信息 ,通过 相互 
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协作 完成 翻译 。 
第 四 ,教师 通过 控制 台 提供 专家 译文 供 学 生 观 摩 、 评 价 ` 学 习 并 选择 恰当 的 翻 
译 方法 。 


15.6 小 结 


传统 翻译 教学 理论 注重 技巧 传授 和 学 生 的 实践 能 力 , 教 师 在 教学 过 程 中 起 主 
导 作用 。 在 这 种 教学 理念 下 ,学 生 面 对 的 往往 是 教材 中 数量 有 限 且 少 有 例外 的 零 
散 范例 ,翻译 质量 的 评估 几乎 完全 依赖 教师 的 直觉 判断 ,学 生 的 自主 判断 和 自主 构 
建 策略 的 能 力 因 之 难以 充分 发 挥 。 本 项 研究 对 这 一 传统 理念 做 出 修正 ,认为 翻译 
教学 的 目标 是 提高 译 者 灵活 运用 翻译 技巧 来 处 理 问题 的 能 力 , 因 此 ,分 析 真实 文本 
显然 有 助 于 学 习 者 将 来 承担 好 真实 的 翻译 任务 ;自主 学 习 环境 是 提高 翻译 教学 效 
果 的 关键 ,而 语料库 是 实施 自主 学 习 的 重要 物质 条 件 。 这 样 ,在 语料库 支持 下 的 发 
现 式 (自主 式 ) 教 学 环境 里 ,翻译 教学 就 可 以 从 技巧 传授 转向 技巧 意识 培养 ,还 可 以 
丰富 评估 的 方式 。 这 不 仅 意味 着 传统 翻译 教学 理念 的 改变 ,也 意味 着 学 生 学 习 观 
念 的 改变 。 

本 章 从 理论 上 论述 了 对 应 语料库 用 于 翻译 教学 的 诸多 优点 :1) 避 免 翻译 学 习 
者 盲目 接受 技巧 和 译文 分 析 的 框架 ,在 掌握 典型 翻译 技巧 的 同时 注意 到 翻译 的 多 
样 性 ;2) 最 大 限度 地 挖掘 合作 性 学 习 的 潜能 ;3) 为 学 习 者 的 情感 投入 和 自我 评价 提 
供 机 会 ,提高 学 习 者 自我 投入 的 积极 性 ;4) 有 助 于 学 习 者 积极 地 看 待 翻译 ,独立 思 
考 并 愿意 寻求 解决 问题 的 方法 。 


第 16 章 


双语 对 应 语料库 与 翻译 教学 


本 章 探 讨 平行 对 应 语料库 在 翻译 教学 中 的 应 用 价值 。 我 们 认为 ,双语 对 应 语 
料 库 对 于 翻译 教学 是 有 用 的 参考 工具 或 工作 平台 ,其 作用 主要 体现 在 :1) 对 某 一 检 
索 词 或 短语 提供 丰富 多 样 的 双语 对 译 样 例 ;2) 为 常用 结构 提供 多 种 双语 对 译 样 例 ， 
供 讲解 和 仿 习 ;3) 提 供 丰 富 的 可 随机 提取 的 一 本 多 译作 为 对 照 参考 。 在 翻译 教学 
中 利用 双语 平行 语料库 和 检索 工具 ,其 作用 是 其 他 教科 书 和 工具 书 所 不 能 替代 的 ， 
在 翻译 教学 中 有 广阔 的 使 用 前 景 和 潜在 的 开发 价值 。 


16.1 引言 


翻译 教学 离 不 开 双 语 语 料 ,而 大 规模 的 双语 对 应 语料库 也 是 在 近 十 几 年 里 开 
始 研 制 ,经 过 理论 探讨 和 实证 检验 ,已 经 逐渐 形成 了 基于 语料库 的 翻译 研究 范式 ， 
但 在 翻译 教学 方面 对 双语 库 的 应 用 尚 属 一 个 新 的 探索 领域 。 凭 借 这 种 双语 语 料 
库 , 不 仅 可 以 进行 语言 对 比 研究 ,还 可 利用 它 开 展 广泛 的 翻译 教学 与 研究 (包括 自 
动 翻译 ), 以 及 双语 词典 的 研 编 。 长 久 以 来 ,翻译 教学 的 重点 一 直 放 在 探讨 译文 与 
原文 之 间 如 何 达到 对 等 的 问题 上 ,这 种 以 “对 等 "为 核心 概念 的 教学 模式 通常 都 是 
以 独立 的 原文 文本 与 参考 译文 对 照 \ 讲 练 为 手段 ,缺乏 对 学 生 翻译 意识 的 培养 , 抹 
杀 了 学 生 在 翻译 训练 中 的 主动 性 和 创造 性 。 本 章 以 汉 英 对 应 语料库 为 语 料 来 源 ， 
以 大 量 例证 来 探讨 双语 对 应 语料库 在 翻译 教学 上 的 用 途 。 


16.2 双语 对 应 语料库 辅助 翻译 教学 及 其 特点 


所 谓 双语 对 应 语料库 辅助 翻译 教学 ,是 指 借助 大 规模 原文 及 其 对 应 译文 的 电 
子 文本 , 辅 以 计算 机 统计 手段 的 翻译 教学 模式 ,该 模式 肯 在 从 翻译 产品 人 手 ,通过 
观摩 .对 比 、 分 析 、 借 鉴 的 方式 发 挥 学 生 的 主动 性 ,培养 学 生 的 翻译 意识 ,在 评估 他 
人 译作 和 自我 实践 的 基础 上 提高 学 生 的 翻译 技能 。 目 前 国际 上 关于 利用 双语 对 应 
语料库 提高 翻译 教学 的 研究 已 有 一 些 , 如 Zanettin, F. , S. Bernardini & D. 
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Stewart(2003) 所 编 翻 译 教育 中 的 语料库 》(Corzora in Translator Education i= 
文集 ,其 中 不 少 论文 有 一 定 参考 价值 。Bernardini(1997) 指 出 ,翻译 教学 辅 之 以 对 
应 语料库 检索 ,便于 翻译 专业 学 生 形 成 一 种 翻译 的 “意识 ”“ 反 射 " 和 “应 变 ”, 这 些 
技能 “使 专业 译员 有 别 于 那些 不 熟练 的 业余 爱好 者 ”。Zanettin(1998) 也 举例 证 明 
双语 对 应 语料库 应 用 于 翻译 教学 有 助 于 提高 学 生理 解 原文 并 用 更 流畅 的 目标 语 进 
行 翻译 的 能 力 。Friedbichler & Friedbichler(1997) 的 研究 表明 ,将 外 语 译 成 母语 
时 ,参照 双语 对 应 语料库 核对 有 关 翻 译 问题 ,能 够 帮助 翻译 学 员 或 译 者 提高 表达 能 
力 , 减 少 译文 的 错误 。 将 母语 译 成 外 语 时 ,对 语料库 工具 的 需要 更 是 成 倍增 加 。 利 
用 对 应 语料库 ( 配 以 合适 的 检索 工具 ) 便 于 查找 特定 表达 方式 的 译 法 ,使 术语 和 短 
语 的 翻译 更 加 准确 、 地 道 ,而 且 常 常 可 以 提供 多 个 翻译 选择 或 翻译 参考 , 比 双语 词 
典 的 例证 更 为 丰富 、 更 为 真实 。 另 一 方面 ,双语 对 应 语料库 也 是 开发 机 器 翻译 系 
统 , 改 进 翻译 软件 的 主要 资源 ,如 基于 例句 的 机 器 翻译 (EBMT) 和 基于 统计 的 机 器 
翻译 ,都 是 以 对 应 语料库 为 基础 的 。 这 些 对 今后 的 翻译 教学 都 会 有 很 大 的 帮助 。 
国内 因 双 语 对 应 语料库 的 研制 起 步 较 晚 ,应 用 于 翻译 教学 研究 的 论述 较 少 ,近年 在 
这 方面 的 讨论 有 主要 有 柯 飞 (2002a,2002b,2004)、 叶 常 青 (2003) , FHL (2004), 
韦 瑶 瑜 . 雷 芋 (2006) 等 。 

H. L. Dreyfus & S, E. Dreyfus 将 专业 技能 习 得 的 过 程 划 分 为 五 个 阶段 :1) 
新 手 阶 段 (novice) ,识别 与 该 技能 相关 的 各 种 客观 事实 和 特征 ,并 在 此 基础 上 习 得 
决策 行为 的 各 项 规则 ;2) 高 级 初学 者 阶段 (advanced beginner) ,识别 各 种 相关 的 情 
境 特征 ,包括 明确 界定 的 和 未 加 明确 界定 的 ;3) 能 力 培养 阶段 (competence) ,依照 
目的 ,按照 层次 进行 决策 ;4) 效 率 阶段 (proficiency) ,直觉 的 理解 加 上 有 意识 的 行 
为 ;5) 专 业 技 能 阶段 (expertise) ,理性 、 自 发 行为 的 产生 ( 转 引 自 Chesterman 1997; 
147-150)。 从 这 一 过 程 可 以 看 出 ,任何 技能 的 习 得 过 程 都 会 经 历 由 个 体 认识 到 整 
体 认识 ,由 有 意识 的 反映 到 无 意识 的 反应 ,由 分 析 性 决策 到 直觉 性 决策 的 过 程 ( 同 
上 :150) ,翻译 能 力 的 习 得 也 不 例外 。 就 学 生 翻 译 意识 的 培养 ,Chesterman 有 三 个 
建议 :第 一 ,提供 给 学 生 各 种 类 型 的 翻译 文本 ,将 原 语文 本 与 翻译 文本 加 以 比较 ， 
来 认识 各 种 原 语 - 译 语 关系 ;第 二 ,将 某 一 原 语文 本 以 不 同 的 方式 进行 翻译 ,来 认 
识 原 语 - 译 语 关系 在 具体 翻译 实践 中 的 变化 ;第 三 ,对 翻译 个 案 中 不 恰当 的 原 语 - 
译 语 关系 进行 研究 ,尝试 提出 新 的 策略 (同上 :157-158) 。 这 些 方法 无 疑 在 翻译 
教学 实践 中 具有 重要 的 指导 意义 ,而 双语 对 应 语料库 正 是 实现 这 些 设想 的 较 佳 
工具 。 

Monz6(2003) 指 出 ,要 让 翻译 学 习 者 认识 翻译 ,最 好 的 办 法 就 是 让 他 们 置身 其 
中 (exposure) ,而 双语 库 是 创造 此 种 翻译 环境 的 一 条 途径 , 因为 通过 双语 平行 语 
料 , 不 仅 能 让 学 生 直接 观察 原 语 语言 系统 的 规则 ,也 能 看 到 翻译 文本 的 自身 特征 ， 
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建立 对 翻译 转换 的 感性 认识 。 与 传统 的 翻译 教学 模式 相 比 ,双语 对 应 语料库 辅助 
翻译 教学 具有 三 个 特点 :第 一 ,在 理念 上 ,借助 真实 的 翻译 产品 帮助 学 生 建立 关于 
翻译 的 意识 。 如 对 翻译 教材 的 认识 ,不 仅 局 限于 以 独立 的 词汇 .句子 、 文 本 及 其 参 
考 译文 为 对 象 ,而 是 以 大 规模 的 各 种 原文 及 其 译文 的 电子 对 应 语 料 作为 工具 ,以 计 
算 机 作为 辅助 手段 ,来 帮助 学 生 认 识 与 翻译 实践 相关 的 各 种 因素 ;第 二 ,在 性 质 上 ， 
改变 传统 翻译 教学 中 规定 性 (prescriptive) 方 法 ,将 描写 性 (descriptive) 因 素 融 人 翻 
译 教学 实践 中 ,通过 观摩 现 有 的 翻译 产品 ,进行 对 比分 析 , 加 深 对 于 翻译 活动 的 认 
识 ;第 三 ,语料库 辅助 翻译 教学 的 核心 原则 是 让 学 生成 为 教学 活动 的 主体 ,调动 学 
生 的 主动 性 ,在 观察 ,对 比 \ 分 析 、 借 鉴 中 提高 学 生 翻 译 的 意识 和 应 变 能 力 , 从 感性 
认识 达到 理性 和 自发 的 反应 。 本 文 主要 讨论 双语 对 应 语料库 对 于 翻译 教学 有 何 用 
处 ,或 如 何 将 其 用 之 于 翻译 教学 。 


16.3 双语 对 译 检 索 用 于 翻译 教学 


北 外 的 汉 英 对 应 语料库 是 一 个 句子 层面 上 双语 、 双 向 对 应 的 语料库 ,检索 任何 
词语 ,无 论 英语 或 汉语 ,都 可 将 该 词语 所 在 的 所 有 语句 提取 出 来 ,并 同时 显现 该 语 
名 所 对 应 译文 , 即 双语 始终 链接 ,在 一 个 界面 上 显现 。 在 北京 大 学 计算 语言 学 研究 
所 的 帮助 下 研制 的 检索 软件 (concordancer1208) 可 以 进行 词语 、 特 殊 结 构 、 搭 配 关 
系 、 词 频 等 检索 ,包括 英语 单词 的 各 种 届 折 变化 形式 可 一 并 检索 (如 输入 动词 be, 
可 同时 将 is, am, was,are, were, being, been 一 并 检 出 )。 这 样 ,用 之 于 翻译 教学 ,该 
语料库 至 少 可 以 完成 一 下 辅助 工作 : 

、 对 某 一 检索 词 或 短语 提供 丰富 多 样 的 双语 对 译 样 例 ; 

二 、 对 常用 结构 的 提供 多 种 双语 对 译 样 例 , 供 讲授 者 讲解 ,学 习 者 借鉴 

三 、 提 供 可 随机 提取 的 一 本 多 译作 为 对 照 参考 。 

下 面 我 们 分 别 以 例证 加 以 说 明 。 


16.3.1 词语 的 对 译 检索 


英语 和 汉语 绝 大 部 分 词语 都 不 是 一 一 对 应 的 ,往往 有 多 个 义 项 和 相应 的 译 语 ， 
这 在 翻译 中 随时 都 能 感受 到 。 学 生 在 翻译 学 习 或 翻译 练习 中 宜 加 强 这 方面 的 意 
识 。 双 语 对 应 语料库 能 在 检索 时 提供 较 多 的 例句 ,有 助 于 学 生 丰 富 对 译 词语 ,感受 

16.3.1.1 overcome 与 “克服 ” 

例如 随机 抽取 “克服 ”这 个 词 进行 检索 。 在 汉 译 英 非 文 学 语 料 (85 万 字 词 ) 中 ， 
我 们 检索 到 24 处 使 用 “克服 ”, 英 译 时 15 处 使 用 overcome( 含 其 届 折 形式 ,下 
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同 ), 如 : 


(1) 有 了 这 样 的 团结 ,任何 困难 和 挫折 都 能 克服 。 
With unity like that we can overcome any difficulty or setback. 
(2) 要 克服 一 个 怕 字 ,要 有 勇气 。 


We should overcome our fears. 
但 有 九 处 作 另 外 的 处 理 。 如 : 


(3) 那 次 大 会 总 结 了 我 国民 主 革命 二 十 多 年 曲折 发 展 的 历史 经 验 ,制定 
了 正确 的 纲领 和 策略 ,克服 了 党 内 的 错误 思想 …… 

The delegates summed up the historically significant experience gained 
in the course of the twists and turns of that revolution during the preceding 
quarter of a century, formulated a correct programme and correct tactics and 
straightened out the wrong ideas inside the Party. 

(4) 但 是 ,我 们 的 社会 主义 政策 和 国家 机 器 有 力量 去 克服 这 些 东 西 。 

But with our socialist policies and state apparatus, we shall be able to 
cope with them. 

(5) 但 是 我 们 有 信心 ,我 们 的 党 、 我 们 的 国家 有 能 力 逐 步 克服 并 最 终 消 除 
这 些 消极 现象 。 

But we are confident that our Party and our country are capable of gradually 
reducing these negative phenomena and eventually eliminating them. 

(6) 抓 住 典型 ,处 理 了 ,效果 也 大 ,表明 我 们 下 决心 克服 一 切 阻力 抓 法 制 
建设 和 精神 文明 建设 。 

Dealing with these cases will have the most effect; it will show our 
determination to surmount all obstacles in strengthening the legal system and 
promoting ethical progress. 

(7) 第 二 个 目标 是 克服 官僚 主义 ,提高 工作 效率 

The second objective of political structural reform is to eliminate 
bureaucratism and increase efficiency. 

(8) 要 相互 容忍 ,相互 谦让 ,相互 帮助 ,相互 补充 ,包括 相互 克服 错误 和 
缺点 。 

You should be tolerant and generous with each other, help each other, 
complement each other’s thinking and help correct each other’s mistakes and 
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shortcomings. 


我 们 从 英 译 汉文 学 语 料 (185 万 字 词 ) 中 搜索 到 18 个 overcome, 只 有 三 个 对 译 
为 汉语 的 “克服 ”。 从 英 译 汉语 料 中 反 查 “克服 ”所 对 的 英文 原文 , 查 到 13 个 “ 克 
服 ”, 也 只 有 三 处 对 应 overcome, 其 他 的 对 应 如 : 


(9) Knowing your natural temper better than I, he could the better 
judge what arguments to use, whether of tenderness or terror, such as might 
prevail over your hardness and obstinacy, insomuch that you should no longer 
hide the name of him who tempted you to this grievous fall. 

由 于 他 比 我 更 了 解 你 的 秉性 ,他 应 该 是 个 更 合格 的 法 官 ,他 更 清楚 应 该 选 
用 什么 样 的 刚柔相济 的 辞 令 , 来 克服 你 的 物 效 不 驯 以 使 你 不 再 隐瞒 那个 诱惑 
你 如 此 堕落 的 人 的 姓名 。 

(10) She conquered her fears, and spoke: 

HRT AVDA RE AP wT : 

(1D But, few cared enough for that to think of it a second time, and, in 
this matter, as in all others, the common wretches were left to get out of 
their difficulties as they could. 

可 是 注意 到 这 类 事件 并 加 以 考虑 的 人 却 很 少 因而 在 这 件 事 上 也 跟 在 别 的 
事 上 一 样 , 普 通 的 穷苦 百姓 便 只 有 自行 努力 去 克服 困难 了 。 

(12) Greater things than the Doctor had at that time to contend with , 
would have yielded before his persevering purpose. 

即使 当时 医生 要 克服 的 困难 比 现在 还 要 大 得 多 ,在 他 那 坚 持 不 懈 的 努力 
之 下 困难 也 是 会 退让 的 。 

(13) He, on this part, had pretty well fought his weakness down. 

至 于 希 尔 弗 , 他 已 经 比较 成 功 地 克服 了 自己 一 时 的 性 惨 。 


16.3.1.2 find 与 “ 找 /发 现 ” 
又 如 英语 词 fnd。 从 上 述 汉 译 英语 料 中 查 得 86 个 find, 由 “ 找 ” 转 译 来 的 仅 十 
个 ,大 部 分 为 其 他 灵活 的 处 理 : 


(14) 这 条 路 还 没有 开 出 来 ,各 行 各 业 , 包 括 企业 ,都 要 解决 这 个 问题 。 
We have to find ways to provide such opportunities. People in all fields 
of endeavour, including those in enterprises, should try to solve this problem. 
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(15) 我 们 现在 一 方面 是 知识 分 子 太 少 , 另 一 方面 有 些 地 方 中 青 年 知识 分 
子 很 难 起 作用 。 

While there is an overall shortage of intellectuals, in some places young 
and middle-aged intellectuals are finding it difficult to play a useful role. 

(16) 我 没有 想到 ,我 们 党 内 有 些 同志 也 抽象 地 宣传 起 人 道 主 义 、 人 的 价 
值 等 等 来 了 。 

I am amazed to find that some of our Party comrades are preaching 
humanism, the value of the human being and so forth in abstract terms, 

(17) 有 些 话 不 一 定 准确 ,可 能 考虑 不 周到 ,但 是 要 把 世界 局 势 稳 定 下 来 ， 
总 要 想 些 主意 。 

Some of my remarks may not be precise or thoughtful enough. But we 
must rack our brains to find ways to stabilize the world situation. 

(18) 即使 资本 主义 发 达 国家 之 间 相 互 比较 起 来 也 各 有 优 缺 点 。 

Even when we compare the developed capitalist countries, we find that 
each has both strengths and weaknesses. 

(9) 南方 不 发 展 ,北方 还 有 什么 市 场 。 

For where can the North find a market for its products if the South 
remains underdeveloped? 

(20) 余 秋 里 同志 告诉 我 ,现在 军队 的 养 猪 专业 人 员 ,一 到 地 方 就 有 用 处 ， 
司机 到 地 方 是 最 受 欢 迎 的 。 

Comrade Yu Qiuli has told me that soldiers trained in raising pigs can 
readily find jobs. And drivers are in great demand. 

(21) RIRA, BIR ARG HY FEE FETE ME HR RA TO 
的 发 展 。 . 

We now think that although there is still the danger of war, the forces 
that can deter it are growing, and we find that encouraging. 

(22) 只 要 不 放松 ,认真 抓 ,就 会 有 办 法 。 

If we work hard, we shall find a solution. 

《23)“ 消 肿 ”, 比 较 难 的 是 安置 退 下 来 的 几 十 万 干部 。 

But if we do cut back, it will be hard to find jobs for several hundred 
thousand demobilized army cadres. 

(24) 解决 这 个 问题 从 何人 手 , 要 很 好 研究 。 

We have to make a careful analysis to find out how to go about political 
reform. 
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(25) 这 些 人 恰恰 就 在 共产 党 里 


They are to be found, of all places, inside the Communist Party. 


从 上 述 英 译 汉语 料 里 见 到 448 个 find, 许 多 并 不 对 译 为 “ 找 ” 或 “发 现 ”; 实 际 
上 , 译 成 “发 现 ” 有 104 个 , 译 成 “ 找 ” 的 有 77 个 , 即 大 部 分 (267 个 ) 为 灵活 对 译 : 


(26) 只 要 汤姆 讲 的 话 有 百 分 之 二 十 是 真 的 ,她 也 就 心满意足 了 。 

and she would have been content to find twenty percent of Tom’s 
statement true. 

(27) 玛丽 拿 着 他 的 书 , 要 听 他 背诵 ,他 就 竭力 地 云 来 雾 去 地 往 下 背 。 

Mary took his book to hear him recite, and he tried to find his way 
through the fog: 

(28) 他 半 心 半 意 拿 起 笔 ,不 晓得 是 不 是 还 想 得 起 什么 ,能 给 他 写 在 日 
记 里 。 

He picked up his pen half-heartedly, wondering whether he could find 
something more to write in the diary. 

(29) 不 过 ,说 老实 话 ,我 简直 不 敢 相信 他 就 是 那 同一 个 人 呢 。 

But truly, forsooth, I find it hard to believe him the same man, 

(30)“ 你 咋 知道 ?” 

“How did you find that out?” 

(31)“ 你 是 说 ,若是 认定 他 有 罪 的 话 ?”, 

“If he’s found guilty, you mean to say?” 


从 上 述 关 于 “克服 /overcome” 和 “find/ 找 /发 现 ” 等 词语 的 对 译 检索 ,我 们 可 以 
看 到 , 它 不 仅 能 帮助 学 生 查 找 合 适 的 对 译 ,还 有 助 于 学 生 提 高 英语 的 语感 ,特别 是 
做 汉 译 英 时 。 例 如 需 用 英语 表达 “克服 ”之 意 时 ,学 生 就 会 不 单 是 用 overcome, 而 
能 从 语料库 丰富 的 样 例 里 学 会 选择 更 适 其 语 境 的 词 ( 如 surmount, cope with, 
conquer, prevail over, content with, fight down, get rid of, get out of, reduce, 
eliminate, correct 等 ); 另 一 方面 ,从 英语 find 的 使 用 上 也 可 体会 出 它 远 不 只 是 我 
们 所 熟悉 的 “ 找 ”“ 发 现 ?之 类 意思 (如 (14) 至 (25) 诸 例 ) ,而 这 样 的 训练 不 是 仅 利用 
词典 所 能 得 到 的 ,特别 是 通过 英 译 汉语 料 反 查 汉语 词语 的 对 应 英语 词语 。 

16.3.1.3 条 件 连 词 if 

以 单个 文本 作为 翻译 教学 的 材料 ,探讨 翻译 中 对 特定 词类 的 处 理 ,如 汉语 中 表 
示 条 件 关系 的 连词 (如 表 16. 1 所 示 ) 在 汉 译 英 中 是 否 都 会 以 表示 条 件 关 的 英语 连 
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接 词 (如 表 16. 2) 所 示 。 


表 16.1 汉语 中 表示 条 件 关 系 的 连词 
( 陆 俭 明 、 马 真 1985; 黄 伯 荣 、 廖 序 东 主编 2002 等 ) 


连接 关系 类 型 前 置 连词 后 置 连词 


表 16.2 英语 中 表示 条 件 关系 的 连词 
(Quirk et al 1985) 
连接 关系 类 型 wis 句 中 连接 副词 | 连接 语 


if, assuming (that) ,given 
(that) ,supposing (that), 
if only 


unless, as long as,so long | unless, as long as,so long 
强加 条 件 | as, providing/provided as,on condition that, 
providing/ provided (that) 


我 们 以 每 一 个 表示 条 件 关系 的 英语 词汇 在 汉 译 英语 料 (围城 ) 中 进行 检索 ,去 
掉 干 扰 因 素 , 共 获得 539 个 句 对 (如 表 16. 3) 。 


表 16.3 汉 英 翻译 中 条 件 关系 句子 对 应 情况 
(以 (围城 ) 英 译 为 例 ) 


假设 条 件 supposing (that) a 


if given (that), | 


if not, 
otherwise 


以 并 为 例 ,其 中 193 个 句子 是 由 汉语 原文 中 的 条 件 连词 对 译 而 来 。 如 ， 


(32) 假使 这 样 就 会 爱 上 一 个 人 ,那么 ,爱情 容易 得 使 自己 不 相信 ,容易 得 
使 自己 不 心服 了 。 


If I could fall in love with someone that easily, then I can’t either 


148 // ”语料库 翻译 学 探索 


believe in or submit to love. 

GID 你 车 补 写 信和 来 慰问 ,好 比 病 后 一 帖 补药 ,还 是 欢迎 的 。 

If you wrote a letter inquiring after my health it will still be as welcome 
as.an extra dose of medicine after sickness. 

(34) 鸿 渐 气 得 把 手杖 残暴 地 打道 旁 的 树 不 如 趁早 死 了 心 罢 ,给 一 个 未 成 
年 的 女孩 子 甩 了 , 那 多 丢脸 。 

So vexed by this fact，he struck his cane violently against a roadside tree 
and decided he’d better quash all hope from the very start. What a disgrace 
it would be if he were to be jilted by a teen-age girl. 

(35) 内 地 买 不 到 西药 ,各 位 万 一 生起 病 来 , 那 时 候 才 知 道 我 李 梅 亭 的 功 
劳 呢 ! 

You can’t get Western medicine in the interior. If by chance someone 
should get sick, then he’ll appreciate what I, Li Mei-t’ing, have done. 


131 个 句子 是 根据 汉语 中 表示 条 件 关 系 的 标记 词 ,如 连接 副词 ,在 译文 中 以 条 
件 连词 加 以 明示 。 如 ， 


(36) 所 以 病人 怕 死 ,就 得 请 大 夫 , 吃 药 。 

So if a sick man is afraid of death, he’ll call a doctor and take medicine. 

(37) 有 了 下 半 箱 的 药 ,中 国人 全 病死 了 , 李 先 生还 可 以 活着 。 

And with the medicine in the bottom half, if the Chinese all died of 
disease, Mr. Li could still stay alive. 

(38) 你 把 事实 聚拢 来 就 明白 了 。 

If you put all the facts together, you’ll understand. 

(39) 你 自己 不 好 意思 , 托 旁 人 转 问 一 下 也 行 。 

If you feel uncomfortable about asking him yourself, you could have 
someone else ask him for you. 

40) 我 看 见 自己 的 丈夫 给 人 家 笑 骂 , 倒 实 在 受 不 住 , 觉 得 我 的 脸 都 剥 
ÆT. 

Well, if I ever saw my husband being ridiculed and abused, I certainly 
wouldn’t he able to put up with it. I’d feel as if I had been stripped baie. 


而 其 余 的 215 个 句子 ,汉语 原文 中 没有 连接 标记 ,译文 进行 了 连词 添加 。 如 ， 
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UD 三 间 大 学 的 电报 ,家 里 还 没 知道 ,报告 了 父亲 母亲 , 准 使 他 们 高 兴 ， 
他 们 高 兴 头 上 也 许 心气 宽 和 ,不 会 细密 地 追究 盘问 。 

His family still didn’t know about the telegram from San Lii University. 
What if he announced this to his parents? They would certainly be pleased, 
and in their joy they might be more magnanimous and not probe and question 
him very much, 

(42) FRAG HE ERR. 

If you go with him, you’re sure to meet with disaster. 

(43) 有 话 斯 斯 文 文 地 说 。 

If you have something to say, say it like a gentleman. 

(44) 今天 不 早 睡 , 明 天 上 岸 的 时 候 人 萎靡 没有 精神 ,难看 死 了 。 

If I don’t go to bed early, I’ll be all tired out and will look a wreck 
when I go ashore tomorrow. 

(45) RWF, SERA, RAAT, MKD SAT AK 
OR EF ON a ARS BOTT. 

One day early in the morning a special messenger came with a letter 
from Chao Hsin-mei, The letter said that the day before Chao Hsin-mei had 
gone to the Golden Touch Bank to see him but had not found him there. If 
he were free this afternoon, could he please drop by after four for a chat? 
Hsin-mei had something important to tell him. 

(46) 咱们 不 打 不 成 相识 ,以 后 相处 的 日 子 正 长 ,要 好 好 地 交 个 朋友 。 

We wouldn’t have known each other if we hadn’t had a fight. We’ll be 
together for a long time later on, so we should try to be good friends, 

(47) 你 不 信 , 问 他 自己 。 

If you don’t believe me, ask him yourself. 

(48) 阿 福 威 风 百 倍 道 :“ 你 有 种 出 来 。” 

“Come out here, if you have the guts!” Shouted Ah Fu with exaggerated 
authority. 

《49) 让 她 去 造谣 言 得 了 ,反正 没有 人 会 相信 ,我 就 不 相信 。 

Let her spread rumors if she wants. No one’s going to believe them 
anyway. I for one don’t believe them. 

(50) 譬如 一 申 葡萄 到 手 ,一 种 人 挑 最 好 的 先 吃 , 另 一 种 人 把 最 好 的 留 在 
最 后 吃 。 


If given a bunch of grapes, for example, one kind will eat the best ones 
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first, while the other kind will leave the best for last. 

GD 今天 灌 醉 了 你 ,对 不 住 孙 小 姐 的 。 

If I got you drunk today, I wouldn’t be doing right by Miss Sun. 

(52) PRM “RT REE RAT .” ， 

“If you’ re tired,” he said, “then go to bed. I won’t talk anymore. ” 

(53) 你 要 吵 , 随 你 去 吵 。 

If you want to quarrel, then go ahead. 

(54) 你 愿意 挨 饿 ,活该 , 跟 我 不 相干 。 

If you want to go hungry, it serves you right. It makes no difference to 
me, 

《55) 小 心 别 讨 了 你 那 位 好 朋友 的 大 ,一 脚 踢 你 出 来 , 那 时 候 又 回 上 海 ,看 
你 有 什么 脸 见 人 。 

Just be careful you don’t annoy this friend of yours. If he kicks you 
out, and you come back to Shanghai, I’d just like to see if you can face 
anyone then, 


由 以 上 对 译 例句 可 以 发 现 汉语 中 包含 条 件 关 系 的 句子 中 并 不 一 定 要 有 显 性 连 
接 词 ,而 是 依靠 连接 标记 ,语序 语调 等 加 以 传达 ,而 在 译 成 英语 时 往往 会 在 语言 表 
层 加 以 体现 。 

反 过 来 ,我 们 以 英文 文学 文本 (老人 与 海 ) 及 其 汉 译 为 例 ,考察 if 一 词 可 以 发 
现 ,原文 中 包含 计 的 条 件 句 共有 67 句 ,在 汉语 译文 中 有 59 个 都 以 汉语 表示 条 件 的 
连接 词 对 译 出 ,只 有 8 句 隐 去 了 显 性 的 连接 词 。 但 是 ,我 们 仔细 观察 一 下 以 连词 加 
以 对 译 的 句子 ,就 会 发 现 许多 都 可 加 以 修改 ,从 而 更 加 符合 汉语 的 表达 。 如 : 


(56) “If the others heard me talking out loud they would think that I 
am crazy,” he said aloud. 

“要 是 别人 听 到 我 在 自 言 自 语 ,会 当 我 发 疯 了 ,” 他 说 出 声 来 。 

(57) “But I will say ten Our Fathers and ten Hail Marys that I should 
catch this fish, and I promise to make a pilgrimage to the Virgin de Cobre i. if 
I catch him. ” 

“但 是 我 愿意 念 十 遍 《( 天 主 经 ?和 十 遍 《 圣 母 经 ), 使 我 能 逮 住 这 条 鱼 , 我 还 
许 下 心愿 ,如 果 建 住 了 它 , 一 定 去 朝拜 科 布 莱 的 圣母 。” 

(58) But if I eat him fresh enough he won’t be bad. 

但 是 ,如 果 趁 它 新 鲜 的 时 候 吃 ,味道 不 会 差 。 
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(59) It was these sharks that would cut the turtles’ legs and flippers off 
when the turtles were asleep on the surface, and they would hit a man in the 
water, if they were hungry, even if the man had no smell of fish blood nor 
of fish slime on him, 

MERLE th, iS ETEK E E BE REE HT A RR , A 
果 碰 到 饥饿 的 时 候 , 也 会 在 水 里 袭击 人 ,即使 这 人 身上 并 没有 鱼 血 或 黏液 的 
腥 味 。 

(60) If you love him, it is not a sin to kill him. 


如 果 你 爱 它 , 杀 死 它 就 不 是 罪过 。 


将 以 上 汉 译 句子 中 的 “要 是 ”“ 如 果 ” 去 掉 ,基本 上 不 会 影响 句 意 的 表达 ,反而 
更 为 简洁 。 


16.3.2 结构 的 对 译 检索 


英汉 语 都 有 一 些 特殊 的 句 型 和 结构 ,在 翻译 时 如 何 处 理 , 不 是 教科 书 所 能 讲 清 
楚 的 。 需 要 许多 的 例句 给 学 生 以 感性 认识 。 双 语 对 应 语料库 可 以 做 这 方面 的 补 
充 。 例 如 对 汉语 “把 ” 字 结 构 的 翻译 。 我 们 通过 对 双语 平行 语料库 的 考察 ,发 现 把 
字 结 构 通常 有 三 种 形式 ( 王 克 非 2003) 。 如 何 将 其 翻译 成 英语 ,有 哪些 译 法 ? 若 以 
双语 库 作 一 对 译 检索 ,可 以 增加 学 生 对 该 结构 翻译 的 感性 认识 。 例 如 以 下 对 译 : 


(61) 很 娇媚 地 把 头 一 扭 ,她 又 吃 吃 地 笑 着 。 

She tilted her head coquettishly and giggled. 

(62) 杜 竹 斋 把 舌头 一 伸 , 喀 喀 地 笑 了 。 

Tu -Chu-chaff stuck out his tongue, withdrew it, and grinned. 

(63) Bet ERM) FITS RN. 

We have the terrorists on the run. 

(64) RF LABS HEAT RIK 9 ESE EI 

You’ re all to wear long gowns, anyone who shows up in a short jacket 
gets kicked out. 

65) 他 估计 可 以 趴 着 挤 进去 时 ,就 把 头 先 伸 进 去 …… 

He judged he might squeeze through on his knees; so he put his head 
through... 

(66) 和 大 家 一 齐 坐 下 ,大 家 把 对 刘 四 的 不 满意 都 挪 到 他 身上 来 。 


But as soon as he sat down the others transferred their resentment 
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toward Fourth Master Liu to him. 

(67) 甚至 当 他 还 是 个 年 轻 的 孩子 时 ,就 能 把 表 拆 开 又 装 上 。 

Even when he was still a young boy, he could take a watch apart and 
put it together again. 

(68) 他 把 一 支 香 烟 放 在 嘴 里 ,一 半 烟 丝 就 掉 在 身上。 

He put a cigarette in his mouth. Half the tobacco promptly fell out on 
to his tongue. 

(69) 他 把 自己 形容 成 为 一 个 软 心肠 的 人 。 

He describes himself as an old softie. 

(70) 经 济 调研 把 这 一 点 归 因 于 劳动 力 市 场 日 益 灵活 。 

Economic research puts this down to increased flexibility in the labour 
market. 

OD 他 们 喜欢 把 自己 打扮 成 一 无 所 有 的 乙 头 小 子 。 

They prefer an image of penniless tough guys. 

(72) 他 愿意 快 快 把 这 一 天 过 去 ,不 再 受 这 个 罪 。 

So he wished the day would end quickly to end his discomfort. 

(73) EF BBR 

Hand me that switch. 

(74) 把 上 衣 的 纽扣 解 开 ! 

Unbutton your jacket! 


由 上 述 例句 ,总 结 汉语 把 字 结 构 的 译 法 为 

第 一 ,选择 适当 的 英语 使 动 动词 ,包括 用 make/have/get 等 相关 搭配 (如 (61) 一 
(64))5 

第 二 , 仿 汉 语 形 式 :英语 动词 十 宾语 十 补 语 ,或 动词 十 宾语 十 介词 短语 (如 (65) 一 
(70)); 

第 三 ,其 他 变通 方式 (如 (71) 一 (74)) 。 

通过 这 样 大 量 的 对 译 检索 ,学 生 可 以 对 “把 ” 字 结 构 及 其 翻译 又 直接 的 感受 , 教 
师 再 加 以 适当 的 方法 上 的 归纳 和 解释 ,就 能 取得 较 好 的 教学 效果 。 

还 可 以 进行 近似 结构 的 对 译 检索 。 关 于 这 一 点 ,台湾 大 学 高 照明 自 建 了 一 个 
英汉 平行 语料库 ,尝试 进行 近 义 名 的 翻译 检索 。 学 生 可 以 输入 中 文 关键 词 , 从 平行 
语料库 中 搜寻 包含 该 关键 词 的 英文 句子 及 其 译文 ,或 反之 ,输入 英文 词语 而 找寻 对 
应 的 中 文 译文 。 以 “他 心情 很 低落 ”为 例 , 从 语料库 中 可 寻 得 如 下 相近 的 中 英文 短 
语句 子 (高 照明 2004) : 
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心情 郁闷 、 烦 躁 ,情绪 低落 一 get the hump 

这 几 天 他 似乎 情绪 十 分 低落 。 一 His spirits seem to be drooping these days. 
那 消 息 使 士兵 们 士气 低落 。 一 The news chilled the morale of the soldiers. 
士气 高 [消沉 ,低落 ] 一 Morale is high [low, falling]. 

我 今天 情绪 低落 [高 昂 ]。 一 I feel down [up] today. 

他 的 心情 变化 不 定 。 一 His moods change quickly. 

忧虑 使 他 心情 抑郁 。 一 Cares oppressed his spirits. 

他 心情 诅 丧 地 回 家 去 。 一 He went home, dejected in heart. 

他 现在 脾气 [心情 ] 不 好 。 一 Heys in an ill temper [humor]. 

他 心情 不 好 , 拿 妻 子 出 气 。 一 He vented his ill humor on his wife. 


这 些 显然 也 是 一 般 词典 所 不 能 提供 的 帮助 。 
16.3.3 一 本 多 译 的 比照 和 参考 


双语 对 应 语料库 还 往往 能 提供 一 本 多 译 的 丰富 译 例 。 限 于 篇 幅 , 仅 举 一 两 例 。 
如 下 是 王 宗 炎 先生 曾 谈 过 的 例句 : 


The cause of the Republican Party’s defeat in the election is perhaps best 
summed up by a Scottish writer John Arbuthnot, who said, “All political 
parties die at last of swallowing their own lies.” 


其 中 最 后 一 句 斜 体 部 分 的 翻译 有 多 种 : 


一 切 政党 最 后 都 因 知 下 了 自己 的 谎言 而 死 。 

所 有 政党 最 后 不 免 死亡 ,都 是 由 于 谎言 梗塞 了 喉 哆 。 
一 切 政党 最 后 混 不 下 去 ,原因 不 外 平 食 言 太 多 。 

虚 言 假 语 堵 住 了 嗓子 ,这 是 所 有 政党 最 后 失败 的 根 由 。 
一 切 政党 都 因为 说 话 不 算数 ,终于 垮台 。 

所 有 政党 全 是 这 样 :大 话说 尽 之 日 , 即 生命 告终 之 时 。 
一 切 政党 的 结局 都 是 ,骗局 拆 穿 ,政权 丧失 。 

一 切 政党 到 头 来 都 是 ,空头 支票 吃 不 开 呜呼 京 哉 。 


在 翻译 教学 中 ,可 以 让 学 生 自己 试 译 ,并 给 出 所 有 这 些 译 例 供 学 生 评论 。 当 
然 ,这 里 还 可 提出 其 他 译 法 ,例如 :“ 所 有 政党 最 终 都 因为 自 食 谎言 而 灭亡 ”这样 的 
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练习 ,学 生 会 有 兴趣 ,并 从 中 得 到 良好 的 翻译 训练 。 

因为 双语 对 应 语料库 解决 了 大 规模 语 料 存储 的 问题 ,对 于 翻译 工作 者 或 翻译 
教师 来 说 ,最 为 便利 的 莫 过 于 将 所 收集 的 多 种 译本 存储 于 其 中 ,并 可 随时 调 出 加 以 
对 比 研究 。 名 著 重 译 或 复 译 是 非常 多 的 ,一 般 人 很 难 收集 齐全 ,如 ( 简 爱 有 近 20 
个 译本 ,《 傲 慢 与 偏见 ) 的 译本 也 有 十 六 .七 种 之 多 ,《 红 与 黑 》 译 本 据说 有 人 收集 了 
20 个 以 上 ,莎士比亚 戏剧 中 《 汉 姆 雷 特 ) 的 汉 译 本 最 多 ,达到 30 种 。 还 有 诗歌 的 译 
本 ,无 论 是 英 诗 汉 译 还 是 汉 诗 英 译 ,都 常 有 多 种 译本 ,李白 《静夜 思 ) 就 有 十 多 种 译 
文 。 将 多 种 译本 收集 到 平行 语料库 或 翻译 语料库 里 ,就 会 大 大 方便 翻译 的 研究 者 
和 教师 ,对 学 生 进 行 学 习 、 观 摩 和 比较 非 党 有益。 孤立 地 看 待 一 个 译本 ,往往 不 能 
看 出 什么 ,多 个 译本 综合 到 一 起 看 ,就 可 能 有 新 的 发 现 ,对 翻译 对 比 和 翻译 教学 有 
所 帮助 。 


16.4 小 结 


以 上 从 三 个 方面 的 大 量 例证 ,阐释 了 双语 对 应 语料库 在 翻译 教学 上 的 价值 , 表 
明 它 的 确 有 助 于 提高 学 生理 解 原文 并 用 更 流畅 的 目标 语 进行 翻译 的 能 力 。 一 方面 
可 以 帮助 学 生 做 外 译 汉 练 习 ,参照 对 应 语料库 查找 相应 的 译文 ,锻炼 和 提高 自己 的 
翻译 表达 能 力 。 另 一 方面 ,学 生 做 汉 译 外 时 ,会 更 多 地 利用 双语 对 应 语料库 ,特别 
是 其 逆 查 的 方法 ,学 生 可 以 参考 和 借鉴 已 有 译 法 ,有 时 还 有 多 个 翻译 选择 供 参 考 ， 
使 术语 和 短语 的 翻译 更 加 准确 ,译文 也 更 加 地 道 。 此 外 ,双语 对 应 语料库 使 得 自动 
翻译 的 研究 前 景 变 得 明朗 , 反 过 来 也 会 对 今后 的 翻译 教学 有 更 大 的 助 益 。 


第 17 章 


对 应 语料库 翻译 教学 平台 的 应 用 


本 章 通过 语 料 呈现 实验 探讨 双语 对 应 语料库 翻译 教学 平台 的 应 用 效果 。 实 验 
显示 ,学 生 在 观察 语 料 后 能 够 归纳 和 总 结 出 有 意义 的 翻译 技巧 ,并 能 据 此 评估 或 反 
思 自 己 的 翻译 行为 。 实 验 表明 ,在 翻译 课堂 教学 中 使 用 语 料 资源 有 助 于 自主 学 习 
和 发 现 式 翻译 教学 环境 的 创建 ,也 有 助 于 学 习 者 形成 稳定 的 翻译 技巧 。 


17.1 引言 


近 20 年 来 ,语料库 的 创建 和 应 用 取得 了 长 足 发 展 。 对 应 语料库 大 都 在 20 世 
纪 90 年 代 开始 创建 ,起 步 较 晚 ,但 已 展现 出 广阔 的 应 用 前 景 。 在 欧美 ,这 类 语料库 
有 十 多 个 ,涉及 近 20 个 语种 ,如 Hansard( 法 - 英 对 应 语料库 ) 和 ENPC( 英 语 -挪威 
语 对 应 语料库 )(Véronis 2000:14-15); 在 中 国 , 有 中 科 院 计算 所 的 大 规模 汉 英 对 应 
语料库 ,北京 大 学 的 “BABLE 汉 英 对 应 语料库 ”, 以 及 北京 外 国语 大 学 的 “ 汉 英 对 应 
语料库 ”( 该 库 现 有 可 检索 语 料 2 000 万 字 / 词 以 上 , 见 王 克 非 2004a) ,后 者 是 本 项 
研究 使 用 的 主要 工具 。 

对 应 语料库 的 创建 有 两 个 主要 目的 :一 是 用 于 语言 与 翻译 研究 ,二 是 用 于 外 语 
教学 。 用 于 前 者 的 研究 成 果 丰 富 ,涉及 语言 对 比 ,双语 词典 编 繁 和 翻译 研究 
(Laviosa 1997 ; Baker 1999;Serpellet 2000; Hunston 2002) 。 用 于 后 者 尤其 是 用 于 
翻译 教学 的 研究 也 已 取得 不 少 成 果 , 如 Zanettin 1998, Pearson (2003; 15-24) 和 
Bernardini(2004b:97-111) ,但 大 都 研究 平行 语 料 为 翻译 训练 提供 的 可 能 的 资源 和 
手段 ,还 没有 研究 探讨 大 型 对 应 语料库 在 课堂 教学 中 的 实际 应 用 问题 。 


17.2 研究 内 容 
有 关 运 用 语料库 提高 翻译 效率 和 质量 的 研究 还 没有 全 面 展开 ,而 将 对 应 语 料 


库 应 用 于 翻译 教学 的 研究 则 是 刚刚 开始 (Bowker 2003; Bernardini 2004b)。 从 理 
论 上 看 ,语料库 用 于 教学 有 利于 自主 学 习 环 境 的 创建 (Bernardini2004a: 22; RYE 
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武 . 王 克 非 2007)。 自 主 性 学 习 主 要 表现 在 两 个 方面 :研究 性 学 习 和 发 现 式 学 习 
(learning as discovery) 。 前 者 假定 学 习 者 和 教师 研究 兴趣 相投 、 研 究 能 力 相当 ;后 
者 则 鼓励 学 习 者 自行 调节 兴趣 点 ,并 给 他 们 提供 机 会 来 提高 自己 观察 和 处 理 问 题 
的 能 力 ,使 他 们 对 两 种 语言 的 特征 和 差异 有 敏锐 的 觉 识 。 本 章 认 为 ,研究 和 发 现 虽 
不 矛盾 ,但 在 以 技能 培养 为 核心 的 翻译 教学 中 ,不 宜 过 分 强调 学 生 的 研究 能 力 ,发 
现 式 学 习 这 一 提 法 更 合适 一 些 。 

近年 来 ,国内 也 有 研究 关注 语料库 在 翻译 教学 中 的 应 用 问题 。 有 些 研究 探讨 
了 语料库 在 翻译 教学 中 的 用 途 ( 郭 红 2004; 于 连 江 2004; 王 克 非 2004b) ,但 还 没有 
研究 系统 地 探讨 对 应 语 料 在 课堂 教学 中 的 应 用 方式 和 应 用 效果 ,也 没有 研究 关注 
学 生 对 于 语 料 使 用 的 态度 。 鉴 于 此 ,我 们 以 “ 汉 英 对 应 语料库 ”为 翻译 教学 平台 , 探 
讨 在 现 有 技术 条 件 下 翻译 语 料 用 于 翻译 教学 可 能 产生 的 积极 效果 。 


17.3 研究 设计 及 步骤 


实验 使 用 的 翻译 语 料 全 部 取 自 北京 外 国语 大 学 “ 汉 英 对 应 语料库 ”。 语 料 呈现 实 
验 分 为 两 步 。 第 一 步 要 求 受 试 观察 真实 翻译 语 料 ;第 二 步 让 受 试 将 自 认 为 有 意义 的 
发 现 以 书面 形式 表达 出 来 ,鼓励 同学 之 间 ( 一 般 为 同 桌 ) 通 过 商讨 共同 完成 观察 报告 。 


17.3.1 参与 者 


参加 本 次 调查 的 是 某 大 学 外 语 学 院 英语 专业 本 科 四 年 级 学 生 ( 三 个 班 , 136 
人 ) 和 一 年 级 研究 生 (35 人 )。 这 些 学 生 都 在 学 习 翻译 ,此 前 没有 接触 过 语料库 。 
本 研究 主要 观察 学 生 对 语 料 呈现 的 整体 反应 ,因此 ,个 体 和 性 别 差异 未 列 人 考察 范 
围 。 但 是 ,鉴于 语言 水 平 可 能 影响 到 语料库 的 使 用 ,在 整理 数据 时 将 研究 生 和 本 科 
列 为 对 比分 析 的 对 象 。 

实验 分 三 次 进行 。 第 一 次 的 受 试 是 本 科 四 年 级 三 个 自然 班 的 学 生 ,呈现 的 汉 
英 对 译 语 料 涉及 汉语 动词 与 英语 介词 in/at 间 的 对 译 关 系 (呈现 给 1,5 班 ), 以 及 汉 
语 动 词 与 over/with 之 间 的 互 译 D 关 系 (呈现 给 2 班 )。 为 利于 把 握 受 试 对 语 料 的 


© mm: 

隔壁 绍兴 戏 唱 完了 ,你 就 打 贡 ,好 厉害 

After the Shaohsing opera was [over], you started snoring your head off 

PABA RA A FLIER AEB AKT ERE A TB 

he replied [with] a sly grin, then turned away down the street. swinging his stick, though 
he was careful not to walk too fast 
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反应 ,实验 使 用 的 对 应 语 料 由 教师 课 前 筛选 。 在 呈现 语 料 时 ,教师 不 对 学 生 做 任何 
暗示 ,以 保证 学 生 自 主 做 出 判断 。 第 二 次 的 受 试 是 本 科 四 年 级 学 生 , 第 三 次 的 受 试 
是 一 年 级 研究 生 , 这 两 次 实验 使 用 的 翻译 语 料 都 是 汉语 句 群 的 英 译 @。 以 上 三 次 
语 料 呈 现 方式 相同 。 具 体 步 骤 为 : 

第 一 , 语 料 呈 现 一 一 刺激 :将 语言 学 习 者 的 注意 力 集中 于 关键 词 或 结构 的 翻译 
对 应 项 。 语 料 由 教师 挑选 (也 可 以 应 学 生 要 求 或 建议 学 生 自行 检索 ) 。 

第 二 ,学 生 浏览 语 料 :学 生 通 过 考察 语 料 建立 自 认 为 有 效 的 形式 -意义 关联 。 

第 三 ,提示 学 生 记录 他 们 的 心得 和 他 们 认为 有 意义 的 发 现 。 

第 四 ,要 求学 生 回答 一 个 开放 性 问题 :观察 语 料 后 你 有 什么 心得 或 发 现 ? 

让 受 试 回 答 上 面 的 开放 性 问题 有 两 个 目的 :一 是 考察 学 生 对 语 料 呈 现 的 态度 ; 
二 是 观察 学 生 在 浏览 语 料 时 关注 了 哪些 对 翻译 教学 有 意义 的 问题 。 


17.3.2 数据 收集 


本 项 研究 呈现 的 语 料 量 为 1 500~…1 700 个 汉 英 字 词 (汉语 字 与 英语 词 比率 为 
1. 691) ,学生 可 在 十 分 钟 左右 浏览 完毕 。 阅 读 完毕 ,教师 要 求 受 试 回答 一 个 开放 性 
问题 ;观察 语 料 后 你 有 什么 心得 或 发 现 ? 教师 建议 报告 由 两 人 或 多 人 共同 完成 ,长 
短 不 限 。 学 生 的 回答 以 书面 报告 形式 提交 给 老师 , 供 下 一 步 进行 归 类 和 分 析 。 


17.3.3 数据 分 类 


鉴于 学 生 回答 的 问题 是 开放 式 的 ,我 们 采用 吴 一 安 (2005) 使 用 的 主题 一 致 分 
析 方 法 对 学 生 回 答 的 内 容 进行 分 类 ,分 类 后 再 整理 出 受 试 关注 的 内 容 细节 。 这 些 
内 容 以 提 及 频数 的 形式 呈现 出 来 ,形成 附录 中 的 六 个 统计 表 。 

17.3.3.1 受 试 对 语 料 呈 现 的 态度 

三 次 实验 的 对 象 都 是 英语 专业 的 学 习 者 ,他 们 正在 学 习 汉 英 翻译 。 报 告 显 示 
学 生 对 于 汉 英 翻译 时 的 处 理 技巧 比较 敏感 ,而 且 也 表达 了 自己 对 于 语 料 呈 现 的 态 
度 。 如 : 


© 如 ， 

Ola] 

<s>— FRE. </s> 

天 s> 单 趟 直 放 ,不 过 半天 多 ,就 到 了 ;< 一 /s> 

<SREM E. </s> 

<>RAM. </s> 

<s>lt’s a fast boat and didn’t stop on the way, and we did the journey in half a day, but it 
did roll terribly, and made my joints ache. </s> 
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第 一 ,英语 介词 很 有 用 处 ,有 时 比 一 个 句子 表达 得 还 要 清楚 。 

第 二 ,看 似 挺 难 的 汉语 句子 ,用 英语 的 介词 短语 简 简单 单 就 译 出 来 了 ,而 且 带 
有 原文 的 韵味 ,其 乐 无 穷 。 

第 三 ,平时 翻译 时 意识 不 到 用 英语 介词 使 译文 简洁 。 

第 四 ,翻译 不 仅 要 靠 大 的 英语 词汇 量 ,还 要 学 会 灵活 使 用 我 们 已 经 掌握 了 的 词 
汇 和 语法 。 

第 五 ,看 这 些 汉 英 对 译 很 有 趣 ,也 感觉 很 有 用 。 

可 以 看 出 , 受 试 在 观察 语 料 后 不 仅 能 够 意识 到 语言 运用 问题 ,还 能 够 反思 自己 
的 语言 能 力 和 翻译 能 力 ,有 的 甚至 指出 需要 调整 自己 的 语言 学 习 方式 。 总 的 说 来 ， 
学 生 对 翻译 语 料 旦 现 的 反应 是 正面 的 。 

17.3.3.2 报告 内 容 的 分 类 

我 们 把 受 试 报告 的 内 容 分 成 四 类 :技巧 觉 识 , 功 能 认识 ,语言 差异 和 评估 (对 翻 
译 手 段 的 评价 ) 。 

第 一 ,技巧 觉 识 : 受 试 注 意 动词 与 介词 之 间 的 转换 关系 ,也 注意 到 汉语 句 群 在 
英语 译文 中 的 组 合 方式 。 这 说 明 受 试 具有 从 对 应 语 料 中 觉 识 到 翻译 技巧 的 能 力 。 

第 二 ,功能 认识 : 受 试 注意 到 一 些 英语 的 介词 能 够 引入 时 间 、 状 态 、 年 龄 .同时 
性 等 背景 信息 ,还 注意 到 英语 连词 ,从 句 在 语言 组 织 上 的 独特 作用 。 这 说 明 受 试 对 
技巧 的 觉 识 与 他 们 对 词汇 和 语法 功能 的 认识 是 相通 的 。 

第 三 ,语言 差异 :有 些 受 试 注意 到 英汉 两 种 语言 的 差异 。 

第 四 ,评估 :学 生 注意 到 了 某 些 翻译 处 理 方式 产生 的 文体 效果 和 语言 运用 的 灵 
活性 ,说 明 学 生 对 翻译 技巧 有 评价 能 力 。 

以 上 分 类 说 明 , 在 呈现 汉 英 翻译 语 料 后 , 受 试 对 于 翻译 技巧 .词汇 -语法 功能 、 
语言 差异 比较 敏感 ,同时 也 注意 到 了 翻译 技巧 的 运用 效果 。 这 些 都 表明 , 受 试 能 够 
有 效 地 观察 和 评价 翻译 语 料 ,翻译 语 料 呈 现 的 作用 是 积极 的 。 


17.4 结果 与 分 析 


17.4.1 第 一 次 呈现 的 语 料 


第 一 次 语 料 呈现 后 , 收 到 的 64 份 报告 中 有 41 份 ( 占 64%) 提 及 汉语 动词 和 英 
语 介词 短语 在 翻译 中 的 转换 问题 ( 见 表 17. 1 至 表 17. 3) 。 表 中 显示 ,有 关 技 巧 觉 识 
方面 的 内 容 出 现 频率 最 高 ,也 最 集中 。 统 计 还 显示 , 受 试 对 于 介词 的 功能 也 做 了 较 
为 全 面 的 归纳 ,但 多 停留 于 对 共 现 词 项 的 描述 ,不 如 对 技巧 的 沉 识 那么 集中 。 另 
外 , 表 17. 1 至 表 17. 3 显示 , 受 试 陈述 个 人 对 译文 的 评价 时 主要 涉及 文体 效果 (19 
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次 ) 和 介词 使 用 的 灵活 性 (六 次 )。 

统计 还 显示 , 受 试 对 于 不 同类 型 的 介词 有 不 同 的 认识 ,这 一 点 主要 体现 在 对 
over with 这 两 个 介词 的 表达 功能 上 。 表 17. 3 显示 受 试 注意 到 介词 的 功能 是 引入 
背景 信息 ,说 明 部 分 受 试 在 观察 翻译 时 已 发 现 汉 英 翻译 时 动词 与 介词 转换 的 内 在 “ 
依据 ,同时 也 注意 到 英语 在 表达 背景 信息 时 可 以 使 用 与 汉语 不 同 的 语言 手段 。 上 
述 内 容 表明 多 数 受 试 能 从 呈现 的 语 料 中 归纳 出 有 意义 的 翻译 内 容 ,并 能 给 予 比较 
合理 的 解释 。 

当然 , 受 试 报告 中 对 于 译文 的 评估 有 失 偏 颇 。 如 表 17. 1 有 两 份 报告 . 表 17. 2 
有 一 份 报告 认为 ,汉语 生动 、 英 语 单调 。 做 出 这 一 概括 的 主要 依据 是 :呈现 语 料 中 
的 汉语 动词 群 都 转换 成 了 英语 译文 中 的 “介词 十 名 物化 ”短语 形式 。 但 这 是 一 种 误 
解 , 教 师 需要 对 此 做 出 分 析 和 说 明 。 

面 对 成 批 出 现 的 语 料 ,只 有 少数 受 试 明确 而 具体 地 提 及 英汉 语言 之 间 差 异 ,说 
明 大 多 数 受 试 还 不 能 在 更 抽象 的 层面 上 思考 语言 差异 问题 。 


17.4.2 第 二 次 呈现 的 语 料 


表 17.1. 表 17.2\ 表 17.3 与 表 17.4、 表 17.5 之 间 存 在 有 趣 的 差异 。 表 17.1、 表 
17.2、 表 17. 3 中 的 主要 内 容 是 词 的 运用 和 功能 ,而 表 17. 4、 表 17. 5 则 主要 涉及 句子 
和 句 际 关 系 。 显 然 ,观察 语 料 的 类 型 不 同 , 受 试 关 注 的 内 容 也 就 不 同 。 例 如 ,呈现 的 
多 为 句 对 应 语 料 时 , 受 试 关注 的 重点 在 词 和 词性 ( 见 表 17.1、 表 17. 2,38 17. 3); 当 
呈现 内 容 为 名 群 对 应 语 料 时 , 受 试 则 将 关注 的 重点 调整 到 衔接 手段 的 使 用 上 ( 见 表 
17.4、 表 17.5)。 总 之 , 受 试 能 够 根据 呈现 的 材料 来 调整 自己 的 注意 焦点 。 但 表 
17. 4 K 17. 5 也 显示 ,个 别 受 试 的 归纳 和 概括 还 有 些 问题 。 例 如 ,有 受 试 认为 英语 
译文 比 汉语 原文 逻辑 性 更 强 。 这 一 判断 只 是 依据 连接 词 使 用 的 数量 ,但 逻辑 性 的 
强 弱 不 是 赁 连词 使 用 的 数量 来 判断 的 。 

本 科 生 受 试 的 报告 显示 出 他 们 对 语 料 感 兴趣 ,也 能 捕捉 到 潜藏 在 译文 后 面 的 
翻译 技巧 。 这 至 少 可 以 说 明 , 本 科 生 能 够 通过 观察 翻译 语 料 ,归纳 并 通过 讨论 来 学 
习 翻 译 技巧 。 这 些 技能 和 心得 在 初期 需要 教师 有 针对 性 地 提供 语 料 , 但 归纳 和 总 
结 都 是 学 生 自主 完成 的 。 从 这 个 意义 上 说 ,翻译 语 料 的 呈现 可 以 有 效 地 帮助 翻译 
学 习 者 获得 翻译 技能 、 提 高 翻译 水 平 。 

此 外 , 语 料 呈现 还 有 助 于 学 生 调 整 学 习 方 法 ,注意 自身 语言 运用 能 力 的 培养 。 
如 有 受 试 在 报告 中 写 道 : 

翻译 不 仅 要 靠 大 的 单词 量 , 还 要 学 会 灵活 使 用 我 们 已 经 掌握 了 的 词汇 。 

有 个 别 受 试 甚至 还 觉察 到 自己 的 语言 直觉 和 实际 运用 之 间 有 距离 。、 如 : 

我 学 了 以 前 不 知道 的 东西 。 发 现 一 个 简单 的 介词 有 不 同 的 意思 和 功能 。 一 丫 
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句子 可 以 有 不 同 的 表达 方式 。 这 些 译文 处 理 技巧 很 精彩 。 看 来 我 还 要 学 更 多 的 东 
西 。 这 些 技巧 能 够 帮助 我 们 译 出 好 的 译文 。 

分 析 真实 文本 可 使 学 生 在 词汇 和 语法 结构 方面 增长 见识 ,这 有 利于 学 习 者 承 
担 真实 的 翻译 任务 。 观 察 语 料 不 仅 能 够 激发 学 习 动 机 ,还 有 助 于 学 生 适 时 调整 翻 
译 学 习 方 式 , 提 高 对 翻译 技巧 的 认识 和 应 用 水 平 。 一 般 说 来 ,通过 考察 一 个 词 或 者 
结构 的 多 个 翻译 例证 ,个 别 性 的 因素 就 会 被 规律 性 替代 ;有 动因 的 翻译 策略 累积 起 
来 就 可 使 学 习 者 感知 到 一 般 的 型 式 并 形成 有 意义 的 概括 。 


17.4.3 第 三 次 呈现 的 语 料 


第 三 次 呈现 的 语 料 与 第 二 次 相同 ,但 受 试 不 同 。 这 一 次 的 受 试 是 一 年 级 学 习 
翻译 理论 与 实践 的 研究 生 。 表 17. 6 显示 , 受 试 对 于 翻译 技巧 细节 的 捕捉 比 本 科 生 
( 表 17.5、 表 17. 4) 受 试 更 细腻 。 而 且 ,他 们 对 于 语言 事实 抽象 能 力 更 强 。 例 如 , 受 
试 在 报告 中 使 用 衔接 手段 、 重 构 、 从 名 这 类 术语 来 表述 问题 ,而 少 用 生动 .地 道 等 仿 
混 的 字眼 来 表达 自己 的 看 法 。 


17.4.4 报告 反映 出 的 问题 


呈现 语 料 可 能 引发 不 当 的 归纳 和 概括 ,原因 主要 来 自 两 个 方面 :一 是 语 料 旺 现 
的 数量 有 限 ,无 法 涵盖 与 某 一 语言 项 目 相关 的 所 有 情形 ;二 是 限于 语言 能 力 和 分 析 
能 力 , 受 试 还 无 法 深入 思考 语言 和 翻译 问题 。 出 现 这 些 问题 是 正常 的 ,但 教师 应 该 
适时 加 以 引导 ,鼓励 学 生 尽 可 能 全 面 地 观察 翻译 和 语言 现象 。 

本 次 实验 使 用 的 语 料 是 教师 检索 后 筛选 出 来 的 ,还 不 是 由 学 生根 据 自己 的 需 
求 自行 检索 。 因 此 ,这 还 不 是 真正 意义 上 的 自主 性 学 习 。 要 想 充分 挖 气 学 生 的 学 
习 动 机 和 潜力 ,就 应 鼓励 学 生 按 照 自己 的 需求 去 检索 、 获 得 和 研究 真实 语言 素材 ， 
并 提出 自己 的 看 法 。 这 就 为 学 生 作为 “研究 者 ”去 开辟 新 的 研究 领域 带 来 了 实 实在 
在 的 希望 ,而 不 只 是 重复 或 者 评估 别人 的 研究 (Leech 1997:10), 

目前 在 课堂 上 只 是 以 电子 文本 或 者 检索 软件 的 KWIC 形式 呈现 翻译 语 料 , 这 
样 的 呈现 方式 完全 由 教师 控制 ,过 于 机 械 、 单 调 。 鉴 于 此 ,创建 方便 ,迅速 的 语 料 检 
索 和 应 用 环境 ,并 实现 学 习 者 按照 个 人 的 需求 检索 .考察 ,探讨 和 使 用 语 料 ,是 对 应 
语料库 有 效应 用 于 翻译 教学 的 关键 。 


17.5 小 结 


。 Bernardini(2004a:31-2) 指 出 ,语料库 和 语 料 分 析 工 具 似 乎 为 发 现 式 学 习 活 动 
握 供 了 强 有 力 的 辅助 工具 。 规 模 较 大 的 对 应 语料库 能 为 翻译 教学 提供 丰富 多 样 的 
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翻译 素材 ,为 灵活 运用 翻译 技巧 提供 重要 的 参照 资源 ,也 为 建立 良性 的 课堂 互动 提 
供 重要 的 物质 环境 。 这 些 都 有 利于 激发 学 生 的 学 习 兴 趣 , 促 使 学 生 将 注意 力 集中 
在 与 技巧 密切 相关 的 形式 -意义 关联 上 。 发 现 式 学 习 本 来 不 是 基于 语料库 的 ,但 语 
料 库 却 能 够 有 力 地 促进 自主 学 习 环 境 的 建立 。 

学 习 者 的 观察 结果 可 能 是 局 部 或 者 经 验 式 的 概括 ,但 这 一 观察 结果 可 以 通过 
新 的 证 据 来 检验 、 修 改 和 丰富 。 从 外 语 学 习 和 翻译 技巧 觉 识 上 看 ,学 习 者 大 量 观察 
双语 对 应 语 料 后 可 能 对 搭配 、 语 义 偏向 和 语义 韵 等 现象 更 加 敏感 ;翻译 技巧 和 策略 
可 以 通过 学 生 之 间 和 师 生 之 间 的 互动 性 讨论 逐步 形成 ,这 有 助 于 学 生 形成 稳定 、 持 
久 和 灵活 的 翻译 策略 。 传 统 上 ,教师 在 翻译 教学 过 程 中 起 主导 作用 , 面 对 教 材 中 数 
量 有 限 且 少 有 例外 的 零散 范例 ,学 生 往往 会 盲目 接受 教师 所 陈述 的 规定 性 很 强 的 
翻译 技巧 ,而 翻译 质量 评估 则 完全 依赖 教师 的 直觉 判断 。 这 些 都 无 助 于 培养 学 生 
灵活 运用 翻译 技巧 的 能 力 。 使 用 语料库 可 以 弥补 这 一 方面 的 不 足 , 它 允许 学 生 ( 根 
据 教 师 的 建议 ) 自 主 且 有 针对 性 地 选择 语 料 并 藉 之 做 出 概括 或 解释 ,充分 发 挥 其 自 
主 捕 提 翻译 技巧 和 自主 构建 翻译 策略 的 能 力 。 从 这 个 意义 上 说 ,对 应 语料库 的 应 
用 有 助 于 提升 翻译 教学 的 效果 。 
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第 18 章 


从 语料库 看 翻译 搭配 及 其 教学 


搭配 是 重要 的 语言 组 织 原则 ,这 一 点 在 语料库 语言 学 中 得 到 进一步 证 实 。 汉 
译 英 时 ,一 方面 由 于 受 汉语 原文 中 搭配 模式 的 影响 , 另 一 方面 由 于 英语 不 是 母语 ， 
会 导致 英语 译文 中 的 搭配 不 当 , 进 而 影响 译文 质量 。 本 章 应 用 汉 英 对 应 语料库 ,从 
英 译 汉 和 汉 译 英两 个 方向 分 析 了 “克服 ”一 词 在 汉语 中 的 各 种 搭配 及 其 在 英语 中 的 
对 应 形式 ,阐述 了 对 应 语料库 在 汉 译 英 中 丰富 学 生 搭配 知识 的 作用 。 此 外 ,作者 还 
阐述 了 目标 语 英语 的 单 语 母语 语料库 如 BNC 在 汉 译 英 搭配 教学 中 的 作用 。 


18.1 引言 


搭配 指 的 是 语言 横 组 合 轴 上 词 与 词 的 组 合 。Firth 首先 发 现 词语 之 间 的 横 组 
合 关 系 对 于 揭示 意义 有 重要 作用 。Firth 的 名 言 就 是 “要 了 解 一 个 词 就 须 了 解 其 结 
FEI” (Firth 1957:12) ,如 ass 的 部 分 意义 存在 于 其 习惯 性 同伴 词 silly , obstinate, 
stupid awful 中 (同上 :195)。 进 而 ,Firth 提出 了 “搭配 ”概念 , 即 词语 的 习惯 性 结 
伴 ( 同 上 :99) ,被 后 人 誉 为 “ 措 配 之 父 ”。 现代 语料库 语言 学 通过 对 词汇 的 考察 表 
明 , 搭 配 是 重要 的 语言 组 织 原 则 ,恰当 的 搭配 已 成 为 区 别 母 语 与 非 母语 的 重要 语言 
标志 (Cowie 1994;Channell 1980) 。 搭 配 无 疑 已 是 语料库 语言 学 中 最 为 活跃 的 研 
究 领 域 ,处 于 它 的 中 心地 位 ( 杨 惠 中 等 2002:82) 。 

但 每 一 种 语言 的 词汇 往往 都 有 自己 的 独特 的 搭配 模式 ,在 进行 跨 语言 翻译 时 ， 
人 们 往往 不 能 根据 其 组 成 成 分 直接 进行 翻译 。 所 以 ,搭配 的 翻译 是 翻译 过 程 中 的 
一 个 大 问题 (Baker 1992; Malmkjær 2005; Bahumaid 2006) 。Bahumaid(2006) 指 出 
了 对 搭配 进行 翻译 可 能 遇 到 的 两 大 类 问题 : 语 内 问题 和 语 际 问题 。 语 内 问题 主要 
包括 :1) 搭 配 尚 无 严格 的 定义 ,因此 搭配 与 非 搭配 间 的 界限 不 清 ,例如 ,我 们 没有 明 
确 的 参照 标准 判断 以 下 组 合 是 搭配 还 不 是 搭配 :a good/stronrg"*/jaigh chance" ,a 
good” /strong/high probability 和 a good /strong/high likelihood" ;2) 两 个 或 多 个 
同义词 在 一 语 境 中 可 能 重 番 ,而 在 另 一 语 境 中 可 能 相互 排斥 ,如 remote 和 distant 
都 可 与 past 搭配 ,但 remote 只 能 与 village 搭配 ,distant 只 能 与 memory 搭配 ;3) 有 些 
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搭配 是 一 种 特定 语 域 所 独 有 的 ,如 dull highlights 主要 用 于 气象 学 和 摄影 ;4) 新 的 
搭配 不 断 出 现 , 因 此 译 者 须 不 断 学 习 新 的 搭配 ;5) 搭 配 存在 一 个 度 的 问题 ,对 某 些 
人 来 说 一 种 搭配 是 可 接受 的 ,而 对 另外 的 人 则 不 然 。 语 际 问题 主要 包括 :1) 一 种 语 
言 与 另 一 种 语言 中 的 词汇 搭配 能 力 不 同 ;2? 原 语 中 的 自由 短语 在 目的 语 中 可 能 是 
搭配 ,或 者 相反 , 如 英语 :to overlook something ,阿拉 伯 语 :StEua Ubriga sO, 
3) 词 语 在 原 语 和 目的 语 中 的 搭配 范围 不 同 ,如 英语 :catch a fish/a cold /a train/ 
Firej 阿 拉 伯 语 :Soebh ow 省 Goa 中 二 ped dabl ed Wal soit 
外 ,我 们 认为 ,搭配 具有 内 隐 性 ,不 能 直接 观察 ,往往 需 借助 大 型 的 语料库 才能 发 
现 。 在 汉 译 英 教学 中 ,一 方面 由 于 原文 搭配 模式 的 影响 , 另 一 方面 又 由 于 英语 不 是 
母语 ,学 生 的 措 配 知识 不 够 丰富 ,所 以 学 生 译文 中 出 现 较 多 的 非典 型 ,甚至 是 目的 
语 不 可 接受 的 搭配 模式 ,导致 译文 中 搭配 不 当 , 进 而 影响 译文 质量 。 


18.2 汉 译 英 的 搭配 问题 


汉 英 两 种 语言 搭配 模式 差异 较 大 , 汉 译 英 时 往往 不 能 直接 翻译 ， 否则 就 会 出 现 
翻译 中 的 搭配 错误 。 根 据 我 们 的 观察 , 汉 译 英 中 常见 的 搭配 错误 主要 包括 : 主 谓 拱 
配 错误 ; 动 宾 搭配 错误 ; 定 中 搭配 错误 。 


18.2.1 主 谓 搭配 错误 


英汉 语 存 在 语言 类 型 学 上 的 差异 :汉语 是 话题 突出 语言 (topic-prominent 
language) ,英语 是 主语 突出 语言 (subject-prominent language) (Li &Thompson 
1981; 草 办 甫 1979)。 实 际 上 ,汉语 中 的 主语 有 许多 情况 下 是 话题 ,而 不 是 主语 , 因 
此 和 谓语 的 关系 较为 松散 ,语义 、 语 法 限制 较 少 。 但 英语 中 话题 名 较 少 ,主语 和 谓 
语 的 关系 紧密 ,语义 语法 限制 较为 严格 。 例 如 : 


(1) 我 们 国家 的 建设 事业 不 仅仅 需要 的 是 工程 师 和 科学 家 ,同样 需要 各 
行 各 业 的 能 工 巧 匠 。 

The building cause of our country needs not only engineers and scientists, 
but talents of various kinds. 

Our country in her development needs not only engineers and scientists, 


D 在 英语 中 to overlook something 是 自由 组 合 ,但 在 阿拉 伯 语 中 是 搭配 。 
© ”英语 中 的 同一 个 catch 到 阿拉 伯 语 中 换 成 了 三 个 不 同 的 动词 。 
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but talents of various kinds. 
(2) 这 个 战略 思想 现在 已 经 有 了 实施 的 机 遇 。 
The strategy now has an opportunity to implement. 
We now have an opportunity to implement the strategy. 


上 述 两 名 在 英语 中 的 “need” 和 “has” 都 需要 有 灵 主 语 ,而 汉语 则 无 此 要 求 。 因 
此 ,不 懂得 这 种 主 谓 搭配 限制 ,就 会 在 汉 译 英 时 出 错 。 


18.2.2 动 宾 搭 配 错误 


(1) 我 想 我 们 不 能 同意 这 样 的 要 求 。 

I’m afraid it is impossible for us to agree with such requests, 

I’m afraid it is impossible for us to grant such requests, 

(2) 有 必要 教 给 学 生 一 些 美国 历史 的 知识 。 

It is necessary to teach students a little knowledge of American history. 

It is necessary to impart students a little knowledge of American history. 

(3) 帝国 主义 和 国民 党 反动 派 的 长 期 统治 ,造成 了 社会 经 济 的 不 正常 状 
态 ,造成 了 广大 的 失业 群 。 

Long years of imperialist and reactionary Kuomintang rule left our 
economy in a chaotic state and caused widespread unemployment. 


例 (1) 和 例 (2) 中 的 “agree with” 和 “teach” 的 宾语 应 为 人 ,这 反映 了 汉 英 搭配 
模式 的 因 循 性 差异 。 例 (3) 中 “cause” 一 般 表 示 造 成 某 种 结果 ,不 能 表示 状态 ,所 以 
“造成 状态 ”就 需 换 为 “left”。 


18.2.3 定 中 搭配 错误 
O 我 是 超市 的 老 顾客 ,所 以 也 不 抱怨 什么 。 


As an old customer of the supermarket, I did not make a complaint, 
As a regular customer of the supermarket, I did not make a complaint. 
(2) 我 们 要 广泛 普及 科学 文化 知识 。 

We need to extensively popularize science and culture, 

We need to popularize science and culture. 


例 (1) 中 的 “old" 在 英语 中 并 无 频繁 的 意义 ,因此 和 汉语 原文 不 对 应 。 例 (2) 中 
的 “popularize "本身 就 已 包含 “广泛 地 ”的 意义 ,因此 在 英语 中 无 需 再 加 “extensively”。 
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由 此 可 见 , 汉 英两 种 语言 在 搭配 模式 上 存在 较 大 差异 。 汉 译 英 中 ,搭配 的 翻译 
是 一 个 大 问题 。 在 这 方面 ,我 们 认为 ,语料库 是 汉 译 英 中 帮助 学 生 丰 富 搭配 知识 的 
重要 手段 。 


18.3 ”基于 语料库 的 汉 译 英 中 的 搭配 教学 


对 于 汉 译 英 中 的 搭配 教学 ,我 们 认为 两 种 语料库 有 较 大 作用 : 汉 英 对 应 语料库 
和 目的 语 为 英语 的 单 语 母语 参考 语料库 。 

首先 ,我 们 看 一 下 汉 英 对 应 语料库 对 汉 译 英 中 搭配 教学 的 作用 。 我 们 以 “ 克 
服 "一 词 的 英 译 为 例 进行 说 明 。 汉 译 英 中 ,汉语 “克服 ”一 词 最 常用 的 英语 对 应 词 是 
“overcome”。 但 通过 对 汉 英 对 应 语料库 (CEPC) 的 检索 ,我 们 发 现 “overcome” 在 英 
语 中 与 “克服 ”在 汉语 中 的 搭配 模式 有 较 大 差异 。 汉 语 中 “克服 ”的 许多 搭配 模式 在 
英语 中 无 法 与 “overcome” 搭 配 。 汉 英 对 应 语料库 中 “克服 ”的 搭配 模式 见 表 18. 1。 
表 18.1 “克服 "的 中 文 搭配 词 

汉 英 对 应 语料库 中 “克服 ”的 中 文 搭配 词 


现象 ,困难 ,矛盾 ,阻力 ,观念 ,官僚 主义 ,危险 ,不 平衡 ,风气 ,逆转 ,思想 , 旧 毒 , 污 
浊 , 波 折 , 回 头 路 ,意见 ,缺点 ,贪污 ,行贿 ,次 窃 , 东 西 ,错误 


我 们 发 现 ,搭配 词 中 除了 “困难 ?阻力 ”缺点 ”外 ,其 他 汉语 搭配 词 一 般 都 不 
能 与 overcome 搭配 。 英 语 中 ,“overcome” 的 常见 搭配 模式 见 表 18. 2。 
表 18.2 “overcome” 的 常见 搭配 词 
英语 中 “overcome” 的 常见 搭配 词 


problem, obstacle, shyness, difficulty, resistance, shortcoming, weakness, friction, 
disadvantage, temptation, prejudice, barrier, hardship, jealousy 


由 于 “克服 ”和 “overcome” 在 英汉 语 中 搭配 模式 的 差异 ,汉语 中 的 “克服 "翻译 
成 英语 时 就 需 进 行 灵活 处 理 ,而 不 应 统统 译 为 “overcome”。 接 下 来 的 问题 就 是 ,如 
何 找到 “克服 ”的 其 他 翻译 形式 。 在 这 方面 , 汉 英 对 应 语料库 可 提供 了 重要 的 参考 。 
我 们 先 按 汉 到 英 的 方向 对 “克服 ”一 词 在 北 外 通用 汉 英 对 应 语料库 中 进行 了 检索 ， 
不 同 搭配 模式 的 翻译 处 理 如 下 : 


克服 


Overcome 


1) 克服 现象 
O 共产 党 员 应 和 党 外 一 切 先进 分 子 协同 一 致 ,为 着 团结 全 国人 民 基 月 
各 种 不 良 现象 而 努力 。Communists should work in harmony with all progressives 
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outside the Party and endeavour to unite the entire people to do away with 
whatever is undesirable. 

(2) 但 是 我 人 有 信心 ,我 们 的 党 ,我 们 的 国家 有 能 力 逐 步 国 中 并 最 终 消除 
这 些 消 极 现象 。But we are confident that our Party and our country are 
capable of gradually reducing these negative phenomena and eventually eliminating 
them. 

(3) 因此 ,共产 党 员 不 能 不 自觉 地 担负 起 团结 全 国人 民 辆 有 轨 各 种 不 良 现 
象 的 重大 的 责任 。Therefore，Communists must consciously shoulder the 
great responsibility of uniting the entire nation so as to put an end to all such 
undesirable phenomena. 


在 英语 中 ,“overcome” 一 般 不 能 和 “phenomena” 搭 配 , 所 以 ,三 个 “现象 ”的 “ 克 
服 ” 译 为 了 :do away with,reduce,put an end to。 


2) 克服 矛盾 

(1) 8 骨 了 矛盾 ,暂时 归于 一 律 了 ;但 不 久 又 会 产生 新 矛盾 ,又 不 一 律 ,又 
mÆ. The resolution of contradictions results in temporary uniformity, 
but new contradictions soon emerge, which means non-uniformity, and they, 
in turn, have to be resolved. 

(2) MARET $A AK | AP ERAT A RH LSE RP, 
我 们 就 将 显得 越发 有 力量 ,我 们 就 不 会 被 敌人 战胜 ,而 要 最 后 地 战胜 敌人 。By 
resolving the contradiction, which is that of “a big fish in shallow water, and 
by adapting our war apparatus to the war situation, we shall prove even 
stronger, and so far from being defeated by the enemy we shall finally defeat 
him. 


在 英语 中 ,“overcome” 一 般 不 能 和 “contradiction” 搭 配 , 所 以 “矛盾 ”的 “克服 ” 
译 为 了 :resolve。 


3) 克 服 阻 力 

抓 住 典型 ,处 理 了 ,效果 也 大 ,表明 我 们 下 决心 柄 胃 一 切 阻 力 抓 法 制 建设 
和 精神 文明 建设 。Dealing with these cases will have the most effect; it will 
show our determination to surmount all obstacles in strengthening the legal 
system and promoting ethical progress. 
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虽然 “overcome” 能 和 “obstaclie” 搭 配 ,但 此 处 还 是 译 为 了 “surmount”。 


4) 克服 观念 

首先 ,是 由 于 历史 上 “好 男 不 当 兵 ”的 传统 观念 我 们 还 未 能 给 以 有 力 的 
QUE; First of all, we have not exploded the traditional myth that “a good man 
does not join the army”. 


我 们 看 到 ,在 此 句 中 ,“ 观 念 ” 转 换 为 了 “myth”。 在 英语 中 ,“overcome” 一 般 不 
能 和 “myth” 搭 配 , 所 以 “观念 ”的 “克服 ” 译 为 了 :explode。 


5) 克服 官僚 主义 

(1) 在 我 们 这 样 大 的 国家 里 ,有 少数 人 病 事 ,并 不 值得 大 惊 小 怪 ,倒是 足 
ARDRE AEX. Ina large country like ours, there is nothing to 
get alarmed about if small numbers of people create disturbances; on the 
contrary, such disturbances will help us get rid of bureaucracy. 

(2) 提高 效率 , 鲍 朋 官 休 主义 ,包括 精简 机 构 , 还 包括 其 他 许多 内 容 。 
Increasing efficiency and eliminating bureaucratism include, among other 
things, streamlining Party and government organs. 


在 英语 中 ,“overcome” 一 般 不 能 和 “bureaucracy” 搭 配 ,所 以 ,“ 官 做主 义 ” 的 “ 克 
服 ” 译 为 了 :get rid of,eliminate。 


6) 克服 危险 

A) 它 能 够 使 我 们 党 得 到 群众 的 监督 , 辆 轨 党 员 陷 落 腐化 的 危险 ,及 时 发 
现 投机 分 子 以 及 破坏 分 子 而 清洗 出 党 ; It can keep the Party under the 
supervision of the masses, so that Party members can avoid the danger of 
becoming degenerate and so that careerists and saboteurs can be uncovered 
and expelled from the Party before it is too late。 

D 所 以 ,斗争 是 国有 胃 投 降 危 险 、 争 取 时 局 好 转 、 巩 固 国共 合作 的 最 主要 
的 方法 。Therefore, struggle is by far the most important means of averting 
the danger of capitulation, of achieving a turn for the better in the situation 
and of strengthening Kuomintang-Commuinist co-operation. 


在 英语 中 ,overcome "一般 不 能 和 “danger” 搭 配 ,所 以 “危险 ”的 “克服 ? 译 为 
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了 :avoid,avert。 


7) 克服 不 平衡 

太 岳 、 太 行 区 一 般 应 在 今年 内 国明 不 平衡 ,完成 发 动 群众 与 组 织 群 众 的 任 
务 。In the Taiyue and Taihang areas we should solve the problem of uneven 
development and arouse the masses and get them organized, for the most 
part, during this year. 


在 此 句 中 ,“ 不 平衡 ”并 不 是 一 个 名 词 。 所 以 英 译 时 前 面 加 了 一 个 “problem”。 
在 英语 中 ,“overcome” 虽 能 和 “problem” 搭 配 , 但 此 处 “不 平衡 "的 “克服 ”还 是 译 为 
了 更 常用 的 搭配 词 :solve。 


8) 克服 风气 

上 述 两 个 运动 的 后 期 ,事前 不 请 示 , 事 后 不 报告 ,不 按 章程 办 事 的 无 政府 
无 纪律 的 风气 ,又 在 抬头 ,请 中 南 、 华 东 各 省 严密 注意 这 些 教训 ,坚决 执行 请 
示 报 告 制度 ,绝对 不 容许 此 种 坏 作风 抬头 。 毛 注 。) 我 们 已 告 各 地 注意 gm 月. 
In the later stages of the two movements, anarchy and indiscipline began to 
gain ground when people concerned did not ask higher authorities for instructions 
or submitting reports afterwards and violated rules and regulations, (Mao’s 
comment; Comrades working in the provinces in south-central and east China 
are expected to pay close attention to this lesson and see to it that the system 
of asking for instructions from above and submitting reports afterwards is 
applied rigorously and that no practices of this undesirable type shall be 
tolerated. ) We have already notified all localities to check this tendency. 


此 名 中 的 “风气 ”, 英 译 时 转换 为 了 “tendency”。 在 英语 中 ,“overcome” 一 般 不 
能 和 “tendency” 搭 配 , 所 以 “风气 ”的 “克服 ” 译 为 了 :check。 


9) 克服 逆转 

在 这 种 形势 下 ,争取 时 局 好 转 , 国 了 辕 时 局 洲 转 的 可 能 性 ,还 是 存在 的 ,中 央 
二 月 一 日 的 决定 是 完全 正确 的 。In these circumstances the possibility still 
exists of preventing the situation from deteriorating and of changing it for the 
better; the Central Committee’s resolutions of February 1 are entirely correct. 
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在 英语 中 ,“overcome” 一 般 不 能 和 “deteriorating” 搭 配 ,所 以 “逆转 ”的 “克服 ” 
译 为 了 :prevent。 


10) 克服 思想 

(1) 党 内 要 分 清理 论 是 非 . 路 线 是非 , 要 开展 批评 和 自我 批评 ,互相 帮助 ， 
BAA. RS SiR. Inside the Party we should distinguish right 
from wrong in terms of theory and of the Party line, conduct criticism and 
self-criticism and help and supervise each other in correcting wrong ideas. 

(2) 经 过 三 查 三 整 ,E 骸 了 党 内 的 混乱 思想 ,团结 了 全 党 ,进一步 联系 了 
群众 ,产生 了 很 好 的 效果 。Through the three check-ups and three improvements, 
the confused thinking within the Party was clarified ，the Party became united 
and its ties with the masses were strengthened; in other words, we achieved 
successful results. 


AWR , “overcome” — At A fil All “ideas” , “thinking” # Be. AFL, “思想 ”的 
“SEAR” PEN T : correct, clarify. 


11) 克服 旧 毒 污浊、 波折 、 回 头 路 

旧 毒 ,污浊 ,革命 进程 中 的 某 些 波折 ,以 及 可 能 的 回头 路 ,只 有 斗争 和 努力 
才能 够 9 由 ,而 且 需 要 长 期 的 斗争 和 努力 。It is only through struggle and 
hard work, and over a long period too, that we can eliminate the old evils, 
the old filth, and prevent setbacks or even reversals in the revolution. 


ERP , “overcome” —AA AEA “evils”, “filth”, “setback”, “reversal” ## fic 
所 以 ,“ 旧 毒 ,污浊 ,波折 ,回头 路 ”的 “克服 ” 译 为 了 :eliminate, prevent。 


12) 克服 意见 

如 果 对 时 局 的 估计 和 任务 的 提出 发 生 过 左 过 右 的 意见 ,而 不 加 以 说 明和 
DUDE, 8th 24 KAN FER. It would be perilous not to point out and correct 
any “Left” or Right deviations in appraising the situation and in defining our 
tasks, 


在 此 句 中 ,“ 意 见 ” 英 译 时 转换 为 了 “deviations”。 在 英语 中 ,“overcome” 一 般 
不 能 和 “deviations” 搭 配 , 所 以 “意见 ”的 “克服 ” 译 为 了 :correct。 
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13) SEARS TRE EB ARS 

WS FF AU RAS b/ AR ARIE RN RATE 
靠 人 民 的 力量 ,一 定 能 够 逐步 加 以 国力。The people detest graft, bribery, 
theft and other dirty practices. I have no doubt that if we rely on the strength 
of the people, we shall be able to gradually eliminate those practices. 


在 英语 中 , “overcome” 一 般 不 能 和 “graft”, “bribery”, “theft”, “practices” ##$ 
配 , 所 以 “贪污 ,行贿 ,盗窃 ,东西 "的 “克服 ? 译 为 了 :eliminate。 


14) 克服 缺点 .错误 

(1) 所 有 这 些 缺 点 必须 加 以 国明 。We must do away with all such 
shortcomings. 

(2) 要 相互 容忍 ,相互 谦让 ,相互 帮助 ,相互 补充 ,包括 相互 国 轨 错 误 和 缺 
点 。You should be tolerant and generous with each other，help each other, 
complement each otherys thinking and help correct each other’s mistakes and 
shortcomings. 

(3) 我 方 反 是 ,我 之 优点 可 因 我 之 努力 而 加 强 , 缺点 则 因 我 之 努力 而 
QUE. On the other hand, our advantages can be enhanced and our shortcoming 
remedied by our efforts. 


在 英语 中 ,“overcome” 能 和 “shortcoming” 搭 配 ,但 以 上 3 句 中 的 “克服 ”还 是 
采用 了 多 种 译 法 ,do away with, correct, remedy。 但 “overcome” 不 能 和 “mistake” 
搭配 ,所 以 第 2 句 中 “克服 ”的 翻译 采用 了 “correct”。 

将 汉 英 对 应 语料库 中 汉 到 英 方向 的 “克服 ”的 英语 对 应 词 小 结 见 表 18. 3。 

表 18.3 “克服 "的 英语 对 应 词 ( 汉 到 英 方 向 ) 
英语 对 应 词 
do away with, surmount, reduce, explode, resolve, surmount, get rid of, avert, solve. 
check, prevent, eliminate, correct, avoid, remedy, put an end to, clarify 


共计 :17 个 


克服 


同时 ,还 可 在 汉 英 对 应 语料库 中 按 英 到 汉 的 方向 对 “克服 ”进行 检索 ,检索 行 
WF: 


(1) Fortunately Scarlett had come into contact with the two men very 
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little, for Will had persuaded her to let him handle the trading while she 
managed the plantation. In his mild-tempered way, Will had straightened out 
several difficulties of this kind and said nothing to her about them. 幸好 思 嘉 
很 少 同 这 两 个 人 发 生 什 么 联系 ,因为 威 尔 早 已 说 服 她 让 他 来 管理 买卖 上 的 事 ， 
而 她 自己 只 管理 农场 。 威 尔 用 他 那 种 温和 的 办 法 国明 了 好 几 种 这 一 类 的 困 
难 。 并 对 她 什么 也 没有 说 。 

(2) Greater things than the Doctor had at that time to contend with, 
would have yielded before his persevering purpose. 即使 当时 医生 要 曙 吕 月 的 困 
难 比 现在 还 要 大 得 多 ,在 他 那 坚 持 不 懈 的 努力 之 下 困难 也 是 会 退让 的 。 

(3) “If I do, she’ll outgrow it and forget about it. ”只 要 我 这 样 做 ,她 就 
会 逐渐 殉 归 它 ,把 它 忘 了 。 

(4) Knowing your natural temper better than I, he could the better 
judge what arguments to use, whether of tenderness or terror, such as might 
prevail over your hardness and obstinacy, insomuch that you should no longer 
hide the name of him who tempted you to this grievous fall. 由 于 他 比 我 更 了 
解 你 的 秉性 ,他 应 该 是 个 更 合格 的 法 官 ,他 更 清楚 应 该 选用 什么 样 的 刚柔相济 
的 辞 令 ,来 四 你 的 秩 效 不 驯 ; 以 使 你 不 再 隐瞒 那个 诱惑 你 如 此 蝴 落 的 人 的 
姓名 。 

(5) Mapping the position of genes on chromosomes gives today’s 
biotechnology researchers a huge advantage over their predecessors in discovering 
the molecular activities involved in diseases and devising new, more effective 
therapeutic interventions to counteract them. 确定 染色 体 上 的 基因 位 置 ,给 今 
天 的 生物 技术 研究 者 来 比 他 们 前 辈 更 大 的 便利 ,例如 发 现 疾病 的 分 子 活动 和 
设计 新 的 更 有 效 的 治疗 介入 方法 ER 疾病。 

(6) We know now, the natural antipathy you strove against, and conquered, 
for her dear sake, BRERA H H T Up Ay eb hy i PRA H REO PE TED 
ELP, HETE. 

(7) But, few cared enough for that to think of it a second time, and, in 
this matter, as in all others, the common wretches were left to get out of 
their difficulties as they could. 可 是 注意 到 这 类 事件 并 加 以 考虑 的 人 却 很 少 。 
因而 在 这 件 事 上 也 跟 在 别 的 事 上 一 样 ,普通 的 穷苦 百姓 便 只 有 自行 努力 去 
DEET. 

(8) He, on this part, had pretty well fought his weakness down. 至 于 希 
RH WEB WR MH T A AAR. 
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将 汉 英 对 应 语料库 中 英 到 汉 方 向 的 “克服 ”的 英语 对 应 词 小 结 见 表 18. 4。 
表 18.4 “克服 "的 英语 对 应 词 ( 英 到 汉 方向 ) 


英语 对 应 词 
克服 straighten out, contend with, outgrow, prevail over, conquer, counteract, get out of, 
fight down 
共计 :8 个 


下 面 ,将 汉 英 对 应 语料库 中 英 到 汉 与 汉 到 英两 个 方向 的 “克服 ”的 对 应 词 总 结 
见 表 18. 5。 


表 18.5 “克服 "的 英语 对 应 词 (双向 ) 


do away with, surmount, reduce, explode, resolve, surmount, get rid of, avert, solve, 
check, prevent, eliminate, correct, avoid, remedy, put an end to, clarify, straighten 
out, contend with, outgrow, prevail over, conquer, counteract, get out of, fight down 


共计 :25 个 


这 样 ,通过 汉 英 对 应 语料库 中 翻译 实例 的 考察 ,学 生 就 会 加 深 对 汉 英 两 种 语言 
中 搭配 模式 差异 的 了 解 ,并 且 找 出 汉 译 英 中 解决 搭配 模式 差异 的 具体 方案 。Pym 
2003) 提 出 了 翻译 能 力 的 最 简 方案 ,包括 两 部 分 :1) 一 种 原文 本 生成 不 止 一 种 ,而 
是 一 系列 的 可 行 的 目标 文本 (TT,TT: 一 TT。) 的 能 力 ;2) 从 上 述 系 列 目标 文本 中 ， 
迅速 ,正确 有 信心 的 仅 选择 一 种 可 行 的 目标 文本 的 能 力 。 该 方案 对 翻译 中 的 搭配 
教学 有 重要 意义 。 由 于 汉 英 搭配 模式 的 差异 , 译 者 首先 应 能 够 生成 一 系列 的 搭配 
模式 或 搭配 变 体 ,然后 从 中 选择 出 最 适合 当前 语 境 的 搭配 选项 ,以 保证 译文 中 的 拱 
配 得 当 。 

此 外 ,由 于 英语 不 是 我 们 的 母语 ,所 以 我 们 认为 汉 译 英 中 目的 语 英语 的 单 语 母 
语 语料库 对 汉 译 英 也 有 一 定 帮助 作用 。 在 汉 译 英 中 ,BNC 是 较 好 的 单 语 母语 参考 
语料库 。 下 面 是 我 们 对 “eyes” 一 词 在 BNC 中 进行 检索 得 到 的 部 分 主 谓 、 定 中 和 动 
宾 搭 配 。 


克服 


1) 主 谓 搭配 

their mouths fell open and their <w NN2> eyes Popped with astonishment, 
but & hellip; & equo; Sladen’s <w NN2> eyes searched for comfort, 
his strong dark face and amber <w NN2> eyes danced between her and 
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shoulders like a caress. Blue <w NN2> eyes smiled from a face that, 

ed the ice in his tone and his <w NN2> eyes surpassed it. She face 

she said automatically, but then her <w NN2> eyes flicked to his 
in alarm 

& equo; she said, anger making her < w NN2> eyes flash. & 
bquo; Somewhe 

y second skin, & equo; His <w NN2> eyes crinkled with amusement. 

cusing me? & equo; he asked, his <w NN2> eyes laughing at her. No 

impossible in any dream. Her <w NN2> eyes flew open as Roman kissed 

s and he went very still, his <w NN2> eyes leaping with fire as he de 

h you, & equo; Claudia said, her <w NN2> eyes darting, from one single 

About time, & equo; he said, his <w NN2> eyes taking in the picture 
she 

e under the flimsy nightgown, his <w NN2> eyes caressing her as 
blatantly as 

o; He smiled again, his <w NN2> eyes hooding as he looked at he 

urned like fire. Luke’s <w NN2> eyes devoured her. & bquo; D 

& equo; he said. Her <w NN2> eyes strayed involuntarily to the 

ch way they would go. His 一 w NN2> eyes glazed on the swaying barley 

ansparent, from the way his amber <w NN2> eyes lingered on every 
inch of 

2) 定 中 搭配 

of brown dust, and their yellow <w NN2> eyes a slightly inebriated, glazed 

rkness of hair, with big golden-brown <w NN2> eyes that saw everything 
as wildly 

ves for a glance from his magnificent <w NN2> eyes. He wouldn’t look 

th the same light, bright aqua-marine <w NN2> eyes that looked out 
from her 

ined fingers and the watery bad-tempered <w NN2> eyes. Oh, she was 
g 

aria looked straight at him with hard <w NN2> eyes. & bquo; I 
still hate 

true, & equo; she insisted, her <w NN2> eyes still stormy. & bquo; 

Not cocky young men with roving <w NN2> eyes and a nice taste 
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in girls 
hidden. His lazy, supercilious 一 w NN2> eyes, too, managed their affect 
features and long, indifferent lapis <w NN2> eyes, belonged to a 
statue rath 
white-faced with huge puffy red-rimmed <w NN2> eyes, his thin hair 
plastered t 
’s really pathetic. His little <w NN2> eyes are completely raw, he can 
the gown round her roughly, his <w NN2> eyes as cold as stones. 
3) 动 宾 搭 配 
to sting and then burn at his <w NN2> eyes so that he was finally forced 
joined with him, and rolled her <w NN2> eyes, having seen the awful pun 
then she dabbed her swollen <w NN2> eyes with the tissues Belinda 


我 们 看 到 ,“eyes” 一 词 在 BNC 中 的 许多 搭配 模式 不 是 常见 的 ,不 是 词典 中 能 
找到 的 ,也 不 是 我 们 所 能 想到 的 ,反映 出 了 英语 语言 中 该 词 的 搭配 模式 特征 。 因 
此 , 汉 译 英 中 ,我 们 需要 对 目的 语 英 语 中 的 搭配 模式 进行 深入 了 解 。 在 这 方面 ， 
BNC 是 重要 的 参考 语料库 。 


18.4 小 结 


搭配 是 汉 译 英 教学 中 的 一 个 大 问题 。 汉 译 英 教学 中 ,搭配 模式 的 转换 是 否 得 
当 往 往 依 赖 授课 教师 的 直觉 。 但 一 个 人 的 语言 直觉 往往 又 是 有 限 的 ,不 能 把 握 过 
多 的 搭配 形式 。 本 章 通过 语料库 对 搭配 模式 进行 调查 ,发 现 汉 英 对 应 语料库 和 目 
的 语 为 英语 的 单 语 母语 语料库 可 为 汉 译 英 中 的 搭配 教学 提供 重要 的 资源 和 参考 。 
一 方面 ,可 为 译 者 提供 搭配 的 多 种 选择 形式 ,开阔 译 者 的 搭配 视野 ; 另 一 方面 还 可 
为 译 者 选择 最 佳 搭配 模式 提供 重要 参考 。 因 此 ,语料库 是 译 者 提高 自身 翻译 能 力 
的 重要 途径 。 
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第 19 章 
计算 语言 学 与 翻译 研究 


通过 对 双语 语 料 的 分 析 , 本 章 从 形式 和 语义 两 方面 探讨 计算 语言 学 方法 对 翻 
译 研 究 的 作用 和 启示 。 在 语言 形式 方面 ,通过 文本 特征 统计 信息 研究 了 双语 文本 
的 基本 形式 特征 ,通过 赋 码 语 料 研究 了 双语 文本 的 深层 句法 信息 。 在 语言 意义 方 
面 ,运用 潜 语义 分 析 方 法 计算 语句 意义 间 的 相似 度 , 语 句 计 算 的 结果 与 人 工 评判 的 
结果 相差 无 几 ,表明 计算 语言 学 的 意义 分 析 方法 十 分 有 效 ,对 判断 多 个 译文 间 、 译 
文 与 原文 间 的 “形似 ”与 “神似 ”有 重要 意义 。 


19.1 引言 


计算 语言 学 (computational linguistics) 是 从 计算 的 角度 对 语言 进行 研究 的 一 
门 学 科 。 俞 土 汶 等 (2003;2) 曾 给 计算 语言 学 下 了 一 个 相对 严谨 而 概括 的 定义 :“ 计 
算 语言 学 指 的 是 这 样 一 门 学 科 , 它 通过 建立 形式 化 的 数学 模型 来 分 析 、 处 理 自然 语 
言 ,并 在 计算 机 上 用 程序 来 实现 分 析 和 处 理 的 过 程 ,从 而 达到 以 机 器 来 模拟 人 的 全 
部 或 者 部 分 语言 能 力 的 目的 .” 计 算 语言 学 与 翻译 有 着 不 解 的 渊源 ,实际 上 就 是 起 
WF 20 世纪 50 年 代 的 机 器 翻译 。 虽然 当时 的 语言 自动 处 理 咨询 委员 会 
(ALPAC) 的 报告 对 机 器 翻译 采取 了 否定 的 态度 ,指出 机 器 翻译 研究 遇 到 了 难以 克 
服 的 “语义 障碍 ”(semantic barrier) 。 然 而 ,计算 语言 学 作为 一 门 交叉 学 科 并 未 因 
此 而 停滞 不 前 。 相 反 , 随 着 人 工 智能 学 科 的 攻 勃 发 展 , 计 算 语言 学 运用 自然 语言 处 
理 方法 对 翻译 研究 起 到 了 越 来 越 重要 的 作用 。 其 实 , 翻 译 与 计算 语言 学 两 者 间 本 
来 就 联系 紧密 ,它们 的 处 理 对 象 同 为 自然 语言 ,所 不 同 的 是 ,传统 翻译 中 语言 处 理 
的 主体 是 人 ,而 计算 语言 学 中 语言 处 理 的 主体 则 是 人 编写 的 计算 机 程序 。 计 算 语 
言 学 中 运用 自然 语言 处 理 方法 所 获得 的 信息 可 以 借鉴 到 翻译 研究 之 中 ,而 惯常 的 
翻译 研究 方法 也 可 以 用 来 指导 计算 语言 学 的 自然 语言 处 理 实践 ,两 者 有 很 多 共 融 
共通 的 方面 。 
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19.2 计算 语言 学 在 翻译 中 的 应 用 


翻译 是 两 种 语言 之 间 的 转换 活动 ,前 苏联 翻译 理论 家 费 道 罗 夫 认为 “翻译 就 是 
用 一 种 语言 把 另 一 种 语言 在 内 容 和 形式 不 可 分 割 的 统一 中 业已 表达 出 来 的 东西 ， 
准确 而 完全 地 表达 出 来 "( 林 煌 天 ,2005:181) 。 费 道 罗 夫 在 他 的 翻译 定义 中 强调 了 
语言 形式 和 内 容 之 间 的 关系 。 王 克 非 (1997:12) ;指出 :“ 翻 译 中 对 原作 要 力求 忠实 
于 内 容 , 兼 顾 其 形式 ,顺畅 地 表达 。” 贝 尔 (1991:5) 也 认为 翻译 实际 上 就 是 把 源 语 中 
的 东西 用 目的 语 表达 出 来 ,并 尽量 保持 其 语义 和 文体 的 等 值 。 在 上 述 关于 翻译 的 
论述 中 ,内 容 和 形式 被 认为 是 翻译 定义 的 两 个 重要 组 成 部 分 ,任何 语言 都 包括 形式 
和 意义 两 个 部 分 ,因此 本 章 拟 从 语言 形式 和 语言 意义 两 个 方面 论述 计算 语言 学 在 
翻译 研究 中 的 作用 。 


19.2.1 语言 形式 方面 


19.2.1.1 文本 语言 特征 统计 信息 

计算 语言 学 采用 自然 语言 处 理 的 方法 提取 文本 特征 统计 信息 , 例如 形 符 
(token) MIZE FF (type) 及 其 比率 、 标 准 化 的 形 符 类 符 比 (standardized type-token 
ratio) ,频率 .平均 词 长 . 句 长 .段落 数目 等 。 下 面 以 鲁迅 先生 的 作品 (风筝) 为 例 试 
做 分 析 ( 译 文摘 自 刘 士 聪 (2002) 编 写 的 4 汉 英 英汉 美文 翻译 与 鉴赏 ) 。 

表 19. 1 和 表 19. 2 的 数据 均 由 语 料 检索 软件 Wordsmith 4. 0 对 《风筝 ) 的 中 英 
文 分 别 进行 词 频 统计 所 得 。 考 虑 到 中 英文 的 差异 ,我 们 在 对 汉语 进行 处 理 之 前 ,用 
中 科 院 汉语 词法 分 析 系 统 (ICTCLAS) 对 汉语 进行 了 分 词 处 理 , 增 强 了 中 英文 的 可 
比 性 。 表 19. 1 的 数据 显示 ,汉语 原文 和 英文 译文 的 文本 特征 统计 信息 存在 较 大 差 
异 , 英 语 的 形 符 数 和 类 符 数 都 明显 高 于 汉语 。 笔 者 曾 以 经 过 ICTCLAS 分 词 后 的 
《红楼 梦 } 及 其 两 个 英文 译本 为 例 进行 查询 ,发 现 (红楼 梦 》 的 原文 词语 数目 为 657 805 
词 ,而 霍 克 斯 译本 的 词 数 达 到 1 140 020, 超 出 汉语 原文 73%% ,而 杨 宪 益 译 本 的 词 数 
也 达到 857338 ,超出 原文 30%。 王 克 非 (2003) 通 过 基于 汉 英 对 应 语料库 的 考察 也 
发 现 译 文 有 扩 增 现象 。 另 外 值得 注意 的 一 点 是 ,两 种 语言 在 句子 数目 上 也 存在 差 
异 。 这 一 结果 从 一 个 方面 表明 了 英汉 两 种 语言 的 句法 特征 。 英 语句 式 一 般 层 次 
感 和 规律 性 较 强 , 句 子 写 得 过 长 常常 会 使 得 句法 层次 感 前 弱 , EE, A 
而 相对 较 少 出 现 ,而 汉语 句子 中 各 成 分 之 间 的 关系 则 常常 较为 松散 和 自由 ,并 列 
句 往 往 更 为 常见 ,这 使 得 汉语 句子 可 以 容纳 的 信息 比 英语 更 多 。 因此 ,在 汉 译 英 
的 过 程 中 ,原文 一 个 句子 在 目标 语 中 常常 需要 分 解 成 两 个 甚至 更 多 的 句子 。 相 
反 , 在 英 译 汉 的 过 程 中 ,原文 两 个 或 者 更 多 的 句子 常常 可 能 合并 成 目标 语 中 的 一 个 
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句子 。 
表 19.1 原文 和 译文 文本 特征 统计 信息 
特征 统计 项 /语种 汉语 原文 英文 翻译 

形 符 832 i 1056 

类 符 393 439 

类 符 形 符 比 47. 236 41. 572 
句子 数目 | 4 51 
平均 句 长 20. 29 20.71 


表 19.2 汉语 原文 和 英语 译文 中 居 前 的 十 个 词 及 其 频率 


表 19. 2 列 出 汉语 原文 和 英文 译文 中 出 现 频率 最 高 的 前 十 个 词语 。 比 较 原 文 
和 译文 中 的 高 频 词 语 可 以 发 现 ,无 论 在 英语 还 是 汉语 中 ,虚词 的 频率 远 远 高 于 实 
词 ,只 是 虚词 的 种 类 有 所 不 同 , 而 这 种 不 同 恰 恰 从 某 种 程度 上 体现 了 英汉 两 种 语言 
之 间 的 差异 ,了 解 这 些 差异 对 翻译 研究 具有 重要 意义 。 根 据 高 频 词 的 使 用 情况 ,我 
们 至 少 可 以 看 到 英汉 语 间 以 下 几 方面 的 差异 :1) 所 属 关系 的 表达 方式 。 由 于 汉语 
词语 几乎 没有 形态 变化 ,常常 通过 助词 来 表达 代词 或 名 词 的 属 格 关系 ,因此 汉语 中 
助词 “的 "出现 的 频率 很 高 (如 “我 的 "“ 风 筝 的 ”等 ) 。 英 语 则 不 同 ,代词 的 属 格 常 通 
过 形态 变化 (如 my 可 以 看 作为 I 的 属 格 ) 实 现 ,名 词 的 属 格 则 常常 通过 在 两 相关 名 
词 间 加 介词 of( 如 roof of the house) 来 实现 ;2) 时 态 的 表现 方式 。 汉 语 依靠 “了 ”、 
“着 ”“ 过 ”等 助词 表现 时 态 ,而 英语 则 通过 动词 的 形态 变化 表现 时 态 ;3) 名 词 限定 
ii] (determiner) HH. 汉语 中 名 词 之 前 的 限定 词 远 远 不 如 英语 中 (如 the, a, my 
等 ) 那 么 常用 ;4) 介 词 的 差异 。 英 语 的 介词 不 仅 使 用 频率 高 ,数量 也 比 汉语 的 多 。 
汉语 介词 “在 ”如 “在 …… 上 ”“ 在 …… 下 ”“ 在 …… 前 ”、“ 在 …… 后 ”等 ) 适 用 于 多 
种 场合 ,而 英语 中 众多 介词 之 间 常 常 有 较为 明显 的 分 工 ;5) 指 代 (reference) 问题 ， 
汉语 倾向 于 省 略 指称 词 , 而 英语 则 出 于 语法 和 语义 的 需要 不 能 省 略 , 例 如 汉语 原 
文中 用 于 指称 事物 的 “ 它 ” 只 出 现 了 一 次 ,而 英语 译文 中 的 “it” 却 高 达 14 次 。 英 
汉语 间 以 上 各 方面 的 差异 对 翻译 研究 和 翻译 过 程 中 目标 语 的 选择 等 都 具有 重要 
意义 。 


182 /语料库 翻译 学 探索 


19.2.1.2 深层 次 文本 特征 挖掘 

对 翻译 文本 的 处 理 , 研 究 者 不 能 只 停留 于 表面 的 文本 特征 统计 信息 ,还 需要 借 
助 语言 处 理工 具 对 现 有 文本 做 进一步 的 研究 。 在 语言 形式 方面 ,除了 上 述 提 及 的 
文本 信息 ,研究 者 还 可 以 对 原文 和 译文 的 词法 \ 句 法 进行 研究 。 

对 文本 的 词法 和 句法 进行 研究 常常 需要 借助 计算 语言 学 领域 的 词性 标注 软件 
(POS Tagger ) 进 行 。 常 用 的 英语 词性 赋 码 软件 有 Brill Tagger ,CLAWS(Constituent 
Likelihood Automatic Word-tagging System) 等 。CLAWS 是 兰 开 斯 特大 学 从 20 
世纪 80 年 代 开始 研制 的 一 种 基于 概率 的 词性 赋 码 工具 ,CLAWS 宣称 该 软件 赋 码 
的 准确 率 达 到 了 97%, 英 国 国家 语料库 (British National Corpus) 就 是 运用 
CLAWS 进行 赋 码 的 。 汉 语 的 词性 赋 码 工具 主要 有 上 面 介 绍 过 的 中 科 院 汉语 词法 
分 析 系 统 (ICTCLAS) 以 及 东北 大 学 自然 语言 处 理 实验 室 研制 的 NEUCSP 分 词 词 
性 标注 工具 等 。 

依旧 以 鲁迅 先生 的 (风筝) 的 翻译 为 例 。 我 们 用 NEUCSP 对 汉语 原文 进行 分 
词 标注 ,英语 译文 则 使 用 CLAWS 进行 词性 标注 。 进 行 词性 赋 码 后 分 别 把 原文 和 
译文 中 的 汉语 词语 和 英文 词语 使 用 自行 编写 的 程序 删 去 ,只 保留 词性 赋 码 。 这 些 
词性 赋 码 实际 上 就 是 原文 文本 和 译文 文本 的 形式 句法 特征 库 。 以 原文 和 译文 其 中 
一 句 为 例 : 


Da 原文 :我 忽然 想起 ,似乎 多 日 不 很 看 见 他 了 ,但 记得 曾 见 他 在 后 园 
拾 枯 竹 。 

Db ”词性 标注 后 的 原文 :我 /r 忽然 /d 想起 /v,/wp 似乎 /d 多 日 /nt 不 / 
d 很 /d 看 见 /v 他 /r 了 /u,/wp 但 /c 记 得 /v 曾 /d 见 /v 他 /r 在 /p 后 园 /n 拾 /v 
th/a ft /n. /wp 

(2)a 译文 :It occurred to me that I did not seem to have seen him for 
days, but remembered having once met him in the back yard collecting dry 
bamboo sticks and twigs. 

(2)b“ 词 性 标注 后 的 译文 :It_PPHI1 occurred_VVD to_II me_PPIO1 
that_CST I_PPIS1 did_VDD not_XX seem_VVI to_TO have_VHI seen_ 
VVN him_PPHO1 for_IF days_NNT2,_, but_CCB remembered _ VVD 
having _VHG once_RR met_VVN him_PPHO1 in_II the_AT back_NN1 yard 
-NNI1 collecting_VVG dry_JJ bamboo_NN1 sticks _NN2 and_CC twigs _NN2 


以 上 词性 标注 使 得 句法 分 析 成 为 可 能 。 我 们 运用 自行 编写 的 词 频 统计 软件 结 
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合 Wordsmith 4. 0 对 词性 赋 码 进行 检索 ,结果 见 表 19. 3: 
表 19.3 ”原文 和 译文 中 居 前 的 十 个 词类 范畴 


U N D P 


V C 
| aaa | cia | (名词 )| aad | (代词 | 形容词)| 《连词 》| (介词 )| ON 


频率 | 191 129 114 99 87 22 20 14 


V P AT 


译文 I J R 
(名 词 )| (介词 )| (动词 )| (代词 ) (形容 词 ) | (副词) 


频率 | 186 | 141 | 136 | 101 


原文 中 ,动词 的 数量 最 多 ,而 译文 中 名 词 的 数量 最 多 ,表明 原文 中 一 部 分 动词 
译 成 了 名 词 , 例 如， 


(3) 灰 黑 色 的 秃 树枝 丫 叉 于 晴朗 的 天 空中 。 
An entanglement of dark-gray bare branches against a sunny sky. 


还 有 一 部 分 动词 翻译 成 了 形容 词 , 例 如 ， 


(4) 他 只 得 张 着 小 嘴 , 呆 看 着 空中 出 神 。 


His tiny mouth open in a gape, watching upward. 


其 次 ,汉语 原文 有 25 个 连词 ,而 英语 译文 有 67 个 连词 。 在 CLAWS 标注 集 
中 ,连词 共 分 为 7 小 类 ,在 本 章 中 出 现 了 5 小 类 ,类 别 数量 如 下 :CC( 并 列 连词 )45 
个 .CST( 连 词 that)9 个 .CS( 从 属 连词 )6 个 .CCB( 转 折 并 列 连 词 )5 个 .CSA( 连 词 
as)2 个 。 从 连词 数量 的 对 比 可 以 看 出 译 者 在 汉 译 英 中 倾向 于 用 显 性 化 的 连接 手段 
来 表达 原文 中 隐 人 性 的 成 分 。 显 性 翻译 被 认为 是 翻译 中 的 一 个 普遍 倾向 
(Chesterman 1997:71)。 柯 飞 (2005:307) 也 指出 “ 汉 译 英 时 会 比 英 译 汉 时 更 多 地 
旦 现形 式 上 的 “ 显 化 ”, 而 英 译 汉 时 则 呈现 更 多 的 模仿 式 的 ' 显 化 ””。 除 了 对 一 元 词 
语 (unigram) 进行 分 析 研 究 外 ,研究 者 还 可 以 对 二 元 词语 (bigram) 和 三 元 词语 
(trigram) 直 至 整个 篇 章 的 句法 结构 进行 研究 分 析 。 在 本 例 中 ,汉语 原文 中 出 现 频 
率 最 多 的 二 元 词语 和 三 元 词语 分 别 是 :D( 副 词 ) 十 V( 动 词 ) 和 DCH) + DCB) + 
V( 动 词 ), 分 别 为 41 次 和 12 次 ;而 在 英语 译文 中 出 现 频率 最 多 的 二 元 词语 和 三 元 
词语 分 别 是 :AT( 冠 词 ) 十 NN1( 单 数 名 词 ) 和 AT( 和 冠 词 ) 十 NN1( 单 数 名 词 ) +10 
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(介词 of) ,分 别 为 50 次 和 18 次 ,基本 与 表 19. 3 中 的 词性 赋 码 频率 相 吻 合 。 当 然 
除了 对 词 元 进行 研究 之 外 ,也 可 以 对 句法 结构 (如 被 动 语 态 定语 从 句 等 ) 进 行 研究 。 


19.2.2 语义 意义 方面 


计算 语言 学 在 语言 意义 方面 研究 的 重要 应 用 之 一 是 对 机 器 译文 和 学 生 译 作 的 
评测 。 对 于 机 器 译文 的 自动 评价 目前 主要 集中 于 两 种 评测 方法 :一 个 是 IBM 提出 
的 BLEU(Bilingual Evaluation Understudy) 的 评测 方法 , 另 一 个 是 NIST(National 
Institute of Standards and Technology) 评 测 标准 。 它 们 都 是 从 文本 的 N 元 词语 
《N-gram) 出 发 , 比 对 测试 文本 和 参照 文本 之 间 的 N 元 词语 的 相似 程度 ,计算 出 被 
测 文 本 和 参考 译文 之 间 的 距离 。BLEU 默认 匹配 四 元 (4 一 gram) 以 下 的 相似 度 , 因 为 
超出 四 元 的 连续 词语 对 自动 评价 的 意义 不 大 。 计 算 BLEU 数值 的 公式 (Papineni & 
Roukous, 2002:311-318) ®: 


N 
Bleu = BP X exp DI w,log P, 
be 


其 中 BP(Brevity Penalty) 为 长 度 罚 分 ;rw 为 各 阶 匹 配 正确 率 的 权重 系数 。 
P, 为 N 元 匹配 时 的 分 数 。 

NIST 是 在 BLEU 标准 基础 上 提出 的 一 个 评测 方法 , 它 考虑 了 信息 权重 的 因 
素 。 这 两 种 评测 方法 实质 上 是 对 被 测 译文 和 参考 译文 在 N-gram 层次 上 进行 匹 
配 ,它们 得 出 的 相似 度 仅仅 是 完全 匹配 了 的 译文 的 重合 度 (overlap) ,这样 的 方法 存 
在 着 一 个 致命 的 弱点 , 即 在 自然 语言 的 使 用 中 ,存在 着 很 多 近义词 项 ,无 法 通过 这 
种 方法 来 计算 语句 之 间 的 相似 度 。 例 如 ,任何 自然 语言 中 都 存在 着 大 量 的 多 词 同 
义 (synonymy) 和 一 词 多 义 (polysemy) 现 象 , 且 语 言 单位 间 的 相似 程度 并 非 非 此 即 
彼 ,以 0 和 1 两 个 极端 值 来 代表 语言 单位 间 的 相似 度 显然 有 悖 常理 。 在 当今 计算 
语言 学 领域 ,自然 语言 中 语言 单位 间 的 相似 度 常常 用 一 1 与 1 之 间 的 若干 数字 来 
表示 ,关系 近 的 相似 度 应 该 接近 于 1, 而 远 的 则 趋向 于 0, 直 至 一 1。 语 义 相 似 度 量 
化 测量 的 方法 之 一 是 借助 于 信息 检索 (information retrival) 领域 的 “ 潜 语 义 分 析 ” 
(latent semantic analysis,LSA) 。 

潜 语义 分 析 运 用 数据 统计 以 及 数学 分 析 的 方法 ,通过 观察 词 项 在 同一 文本 中 
出 现 的 相对 频率 来 计算 语义 的 相似 度 。 洪 语义 分 析 超 越 了 只 停留 在 语句 表层 的 语 
义 分 析 方法 , 它 把 自然 语言 中 的 每 个 文档 视 为 以 词语 为 维度 的 空间 中 的 一 个 点 。 
同样 ,每 个 词语 被 视 为 以 文档 为 维度 的 空间 中 的 一 个 点 ,通过 点 与 点 的 交集 构成 一 
个 矩阵 (matrix) ,而 这 个 矩阵 表征 的 是 整个 一 批文 档 之 间 的 深层 , 即 潜在 的 语义 空 
Ta]. Manning 等 (2005:344) 曾 有 过 -- 段 通俗 的 论述 :“ 潜 语义 分 析 就 是 把 同 现 词 条 
映射 到 同一 维 空间 上 ,而 非 同 现 词 条 映射 到 不 同 空间 上 。 从 这 个 意义 上 来 讲 ,即使 
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查询 字段 和 文档 没有 共同 词 条 ,它们 的 余弦 相似 度 可 能 仍然 很 高 ,其 中 的 缘故 就 是 
同 现 分 析 。 同 现 词 条 被 认为 是 语义 相关 的 ?通过 计算 词语 的 权重 (weighting) 和 
奇异 值 分 解 (singular value decomposition) 对 矩阵 进行 降 维 ,去 除 不 应 有 的 噪声 ， 
保留 语义 空间 中 的 主要 框架 。 在 国外 , Laham(1997)、Landauer, Foltz 和 Laham 
(1998) .Turney(2005) 等 用 LSA 的 方法 做 过 不 少 与 语义 相关 的 研究 ,他 们 得 出 的 
结论 显示 ,通过 LSA 分 析 句 子 间 的 相似 度 , 可 以 有 效 地 避免 自然 语言 中 多 词 同 义 
和 一 词 多 义 问题 ,提高 分 析 的 准确 度 。 经 反复 验证 ,以 LSA 计算 的 句子 间 的 语义 
相似 度 与 人 工 对 意义 判断 的 结果 极为 接近 ,充分 说 明了 LSA 对 语句 的 相似 性 有 着 
很 强 的 预测 作用 ,使 用 潜 语义 分 析 法 分 析 语句 间 的 相似 度 有 着 传统 分 析 方法 无 可 
比拟 的 优势 。 

运用 潜 语义 分 析 可 以 分 析 译 文 的 语义 内 容 并 且 能 够 把 译文 依据 意义 相似 程度 
排序 。 下 面 的 一 句 译文 就 取 自 一 个 由 150 句子 构成 的 小 型 语料库 ,语料库 中 共 包 
A 30 个 句 组 ,每 组 由 相似 度 各 异 的 五 个 句子 组 成 。 


O 原文 :国家 利益 就 是 使 得 国家 资源 物 尽 其 用 。 

1. The national interest lies in all the nation’s resources being put to 
the most advantageous use possible. 

2. The excess land was mostly sold to existing tenants. 

3. Using all the nation’s resources as advantageous as possible represents 
the national interest. 

4, Our national interest was best served by removing the Saddam regime, 
given that we were prepared to dedicate the time and resources to post-war 
Iraq. 

5. The national interest consists in putting all the nation’s resources to 


the most advantageous use. 


我 们 通过 运用 潜 语义 分 析 对 建成 后 的 矩阵 进行 奇异 值 分 解 (SVD) ,然后 计算 
列 向 量 之 间 的 夹 角 余 弦 值 。 这 个 值 介 于 一 1 和 十 1 之 间 , 十 1 表示 文本 完全 重合 ， 
一 1 表示 语义 内 容 完 全 不 相关 。 
表 19.4 SVD 语句 相似 度 计算 结果 


第 一 句 第 二 句 第 三 名 第 四 名 | 。 第 五 句 
向 量 夹 角 1 1. 843087 0. 288002 1. 438137 | 0. 036659 
夹 角 余弦 值 1 一 0. 26894 0. 958813 0. 132271 0. 999328 
pests sass sien ae ma ATOR! | 


186 // ”语料库 翻译 学 探索 


FER 19.4 中 ,以 第 一 句 译文 为 基准 ,与 第 一 句 意 义 最 相似 的 是 第 五 名 ,其 次 为 
第 三 句 、 第 四 名 ,最 不 相似 的 是 第 二 句 。 其 中 ,很 明显 第 一 句 、 第 五 句 和 第 三 句 意义 
非常 相近 ,属于 同一 个 意 群 ,而 第 四 句 则 与 前 三 名 在 语义 上 有 着 较 大 的 距离 ,第 二 
句 则 与 前 面 的 句子 在 语义 上 毫 无 关联 ,其 数值 为 负数 。 语 句 计 算 的 结果 与 人 工 评 
判 的 结果 相差 无 几 , 表 明 计 算 语 言 学 的 意义 分 析 方法 十 分 有 效 ,对 判断 多 个 译文 
间 ,译文 与 原文 间 的 “形似 ”与 “神似 ”有 重要 意义 。 


19.3 小 结 


计算 语言 学 可 以 通过 对 双语 语料库 的 有 效 分 析 , 从 形式 和 语义 两 个 主要 方面 
为 翻译 研究 ,译文 质量 评价 和 机 器 翻译 实践 等 提供 大 量 的 语言 信息 。 该 学 科 中 复 
杂 而 高 效 的 逻辑 运算 .数学 分 析 以 及 高 度 形式 化 的 计算 模型 ,可 以 为 翻译 研究 的 深 
入 提供 重要 的 量化 资源 。 黄 立波 、 王 克 非 (2006:37) 指 出 翻译 研究 不 能 仅仅 局 限于 
语 内 对 比 ,并 且 提 出 “基于 语料库 的 (翻译 ) 普 遍 性 研究 需要 打破 类 比 语料库 研究 模 
式 的 垄断 ,重新 将 源 语文 本 纳入 其 研究 的 视野 "。 借 助 计算 语言 学 的 知识 和 工具 ， 
我 们 可 以 实现 这 一 目标 ,把 源 语文 本 纳入 翻译 对 比 研究 的 视野 之 中 。 借 鉴 计算 语 
言 学 的 方法 和 理论 ,翻译 研究 能 够 拥有 更 为 开阔 的 视野 ,开拓 更 为 广阔 的 空间 。 


第 20 章 


汉 英 对 应 语 料 句 对 检索 


汉 英 对 应 语 料 在 经 过 对 齐 标注 校对 人 库 之 后 , 便 转 化 为 可 管理 的 数据 库 系统 。 
为 使 这 一 宝贵 的 语言 资源 能 够 更 好 地 服务 于 翻译 教学 与 翻译 教学 ,我 们 制作 了 一 
个 前 端 用 户 访问 后 台数 据 库 的 服务 接口 ,通过 较 好 的 人 机 交互 界面 ,提供 一 个 对 双 
语 语言 事实 进行 更 多 复合 条 件 查询 的 检索 系统 。 本 章 简要 介绍 这 一 系统 的 设计 开 
发 思想 及 其 应 用 。 


20.1 引言 


当前 从 事 机 器 翻译 的 研究 机 构 为 建立 较 好 的 语言 模型 和 翻译 模型 ,分 别 在 搜 
集 整 理 双语 语 料 ,建立 起 越 来 越 大 的 双语 对 应 语料库 。 有 的 更 进一步 利用 网 络 息 
虫 等 技术 手段 从 互联 网 上 获取 更 多 翻译 语 料 来 丰富 语料库 。 然 而 建 库 不 是 最 终 目 
的 。 为 了 充分 利用 这 些 语 言 资 源 , 于 是 更 多 检索 工具 也 开发 问世 了 。 由 于 版 权限 
制 等 各 方面 原因 ,目前 能 够 下 载 或 在 互联 网 上 运行 的 双语 语料库 检索 系统 并 不 多 
见 。 即 使 部 分 能 够 运行 ,检索 界面 也 往往 比较 简单 ,比如 只 提供 简单 的 中 英文 字 词 
的 语言 内 容 查找 ,有 些 甚至 没有 进行 基本 的 英语 词 形 还 原 , 因 而 使 得 由 于 检索 词 和 
语 料 中 的 词语 不 一 致 造成 的 漏 检 现象 频繁 发 生 。 同 时 对 检索 的 元 属性 限制 条 件 ， 
辟 如 翻译 方向 的 汉 译 英 、 还 是 英 译 汉 ; 语 体 特征 的 书面 语 还 是 口语 等 属性 检索 基本 
没有 提供 。 由 于 设计 上 的 这 些 缺 憾 ,使 得 以 机 器 翻译 为 主 的 语料库 检索 对 面向 翻 
译 研究 者 和 学 习 者 的 贡献 打 了 一 个 折扣 。 

近年 来 ,在 国家 社会 科学 基金 和 教育 部 人 文 社 科 重点 研究 基地 重大 项 目的 支 
持 下 ,我 们 已 经 建成 了 当今 世界 上 经 过 专业 人 员 校 对 、 规 模 最 大 的 汉 英 对 应 语料库 
( 王 克 非 2004a) 。 本 着 切实 为 翻译 教学 与 研究 服务 的 目的 ,我 们 设计 了 一 个 用 户 检 
索 系 统 , 希 望 通过 简单 的 人 机 交互 接口 ,使 得 更 多 用 户 能 够 方便 地 获取 利用 这 一 宝 
贵 的 语言 资源 。 最 近 我 们 在 北京 外 国语 大 学 中 国外 语 教育 研究 中 心 的 < 中国 外语 
教研 网 ”发 布 了 一 个 Web 版 的 原型 检索 系统 ,以 听取 更 多 用 户 的 意见 和 建议 。 
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20.2 语料库 的 数据 库 转 化 设计 


语料库 作为 海量 语言 事实 材料 的 集合 ,一 般 来 说 ,数量 相对 较 大 。 采 用 一 般 的 
文件 处 理 系统 难以 管理 。 璧 如 我 们 创建 的 汉 英 对 应 语料库 的 总 字数 就 以 千 万 计 。 
搜集 本 身 不 是 目的 ,更 关键 的 是 加 工 利用 。 对 语 料 的 处 理 既 可 以 自行 设计 数据 结 
构 或 采用 专门 软件 进行 管理 。 

为 简化 开发 时 间 ,我 们 在 汉 英 对 应 语料库 平台 中 ,采用 关系 型 数据 保存 、 管 理 、 
检索 语 料 。 因 为 数据 库 本 身 具 有 良好 的 数据 存储 及 管理 与 维护 功能 ,方便 后 续 语 
料 库 不 断 追 加 ;数据 库 还 提供 较 好 的 检索 二 次 开发 接口 设计 ,能 在 此 基础 上 方便 快 
捷 地 定制 特定 的 查询 处 理 。 在 本 项 目 中 ,双语 对 应 语料库 实际 上 设计 为 数据 库 中 
的 一 个 表 (table) 。 该 表 是 由 一 个 个 汉 英 对 应 的 句子 及 其 他 与 句 对 相关 的 元 属性 共 
同 构成 的 记录 (record) 组 成 。 每 条 记录 都 包含 有 如 表 20. 1 所 示 字段 (field, 属 性 》 
的 信息 内 容 。 


表 20.1 数据 库 字 段 设计 及 说 明 


字段 名 类 型 备 注 

英文 句 字符 型 (5000) 一 个 英文 句子 不 超过 5000 字母 
汉语 名 | 字符 型 2000) 一 个 汉语 句子 不 超过 2000 汉字 
源 语言 字符 型 (1) 当前 句子 的 源 语言 (英语 或 汉语 ) 
作者 字符 型 (50) 当前 句子 的 作者 名 
篇 名 字符 型 (50) 当前 句子 所 在 文本 的 篇 名 

_ 类 型 字符 型 (1) | 当前 句子 所 属 的 类 型 ( 取 规定 值 之 一 ) 
文体 字符 型 (1) 当前 句子 所 属 的 文体 ( 取 规 定 值 之 一 ) 
语 体 _| 字符 型 ( D 当前 句子 所 属 的 语 体 ( 取 规定 值 之 一 》 
时 代 | 字符 型 (1) 当前 句子 所 属 的 时 代 ( 取 规定 值 之 一 ) 
段落 ID 数值 型 当前 句子 所 在 段落 相对 全 文 偏 移 量 
句子 ID 数值 型 当前 句子 相对 段落 的 偏 移 量 
文件 名 字符 型 (50) | 当前 句子 所 在 文件 名 


在 如 表 20. 1 所 示 的 数据 库 字段 的 规划 中 ,最 主要 的 是 “英文 句 ” 和 “汉语 句 ”， 
分 别 存 人 互 有 对 应 关系 的 完整 英语 和 汉语 句子 。 英 汉 句 子 还 分 别 进行 了 词类 赋 
码 ,数据 库 记录 中 实际 存放 的 是 带 有 赋 码 标记 的 字符 串 。 其 他 字段 记录 的 是 当前 
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汉 英 句子 对 所 属 语 篇 的 文本 属性 ( 源 语言 文体) 或 依附 属性 (如 作者 名 、 篇 名 ), 璧 
如 从 该 句 源 语言 的 属性 可 以 推 知 是 “ 英 译 汉 ” 还 是 “ 汉 译 英 ” 等 不 同 的 翻译 过 程 ;从 
文体 属性 可 推 知 是 文学 体 还 是 非 文 学 体 等 。 对 语料库 检索 或 过 滤 时 ,可 以 根据 这 
些 字段 属性 给 予 各 类 综合 条 件 的 限制 ,从 而 得 到 所 需 结果 。 


20.3 用户 查询 检索 接口 设计 


将 原始 双语 语 料 的 对 齐 是 创建 双语 对 应 语料库 的 基础 ,标注 是 对 其 加 工 的 深 
入 ,校对 能 够 保证 其 质量 ,人 库 使 得 语料库 成 为 可 管理 的 数据 库 系统 。 检 索 系 统 是 
终端 用 户 与 数据 库 之 间 的 接口 。 通 过 这 一 界面 ,用 户 能 够 比较 简捷 ,方便 有 效 地 
获取 对 语料库 不 同 需求 的 访问 。 


20.3.1 检索 问题 


数据 库 系 统管 理 维护 等 操作 可 以 通过 结构 化 查询 语言 (Structured Query 
Language,SQL) 完 成 。 虽 然 SQL 对 数据 库 管理 员 等 专业 人 士 来 说 并 不 困难 ;但 我 
们 不 能 对 从 事 翻 译 教学 与 翻译 研究 的 用 户 IT 技能 要 求 太 高 。 为 此 系统 提供 了 一 - 
个 图 形 化 的 用 户 查询 界面 。 通 过 这 个 界面 ,用 户 直接 可 以 键入 待 查询 的 内 容 , 同 时 
选择 不 同 元 属性 的 限制 条 件 , 系 统 在 后 台 接受 用 户 输入 后 自动 生成 合适 的 SQL, fr 
令 语句 ,并 对 数据 库 执行 该 命令 返回 用 户 希 望 的 结果 。 该 命令 既 可 能 是 对 语言 翻 
译本 身 的 简单 查询 ,也 可 能 是 结合 更 多 元 属性 限制 条 件 的 复合 查询 。 

所 谓 检索 是 从 数据 库 中 把 满足 用 户 指定 限制 条 件 的 某 些 特定 记录 找 出 来 。 从 
上 文 的 数据 库 结构 设计 中 可 以 看 出 ,所 有 表示 元 属性 的 字段 取 值 都 是 从 固定 集合 
中 取 值 ,并 且 取 值 是 唯一 的 , 壁 如 对 任意 一 个 汉 英 翻 译 句 对 所 处 文本 的 写作 年 代 必 
定 是 “20 世纪 前 ”“20 世纪 上 半 叶 ”和 “20 世纪 下 半 叶 ”中 的 一 个 ,在 数据 库 中 “时 
代 "” 字 段 取 值 编码 必定 为 t1,2,3} 之 一 。 因 此 只 要 熟悉 编码 规则 ,或 参考 帮助 文件 ， 
就 可 以 简单 直接 地 使 用 这 些 元 属性 取 值 作 为 限定 条 件 。 针 对 翻译 现象 本 身 的 检索 
式 则 难度 要 复杂 得 多 。 壁 如 查询 语言 不 一 、 可 能 是 汉语 或 是 英文 ,抑或 是 两 者 混 
合 ; 查 询 长 度 不 一 , 既 可 能 只 有 一 个 词语 ,也 可 能 是 若干 个 短语 ;查询 主体 不 同 ,可 
能 是 词 , 也 可 能 是 码 ,或 是 词 加 码 的 组 合 ;查询 性 质 不 同 , 可 能 是 需要 在 目标 句 对 中 
出 现 的 词语 ,也 有 可 能 是 不 需要 在 目标 句 对 中 出 现 的 过 滤 词 。 

间 类 赋 码 是 一 个 封闭 的 标记 集 , 这 些 标记 可 以 悉数 枚 举 ,检索 起 来 并 不 构成 困 
难 。 用 户 输入 的 查询 词 与 实际 在 语料库 中 出 现 的 词 可 能 由 于 词 形 的 不 一 致 而 造成 
漏 检 或 误 检 。 有 鉴于 此 ,我 们 在 本 系统 中 分 别 采用 模糊 检索 和 词 形 还 原来 解决 此 
类 问题 。 
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20.3.1.1 解决 汉语 分 词 不 一 致 的 模糊 检索 

为 满足 用 户 对 词类 的 检索 ,数据 库 中 存储 的 汉语 句子 都 是 已 经 过 分 词 和 词类 赋 
码 的 文本 ,汉语 词 之 间 都 已 经 添加 了 空格 ,并 且 每 个 词 之 后 都 级 上 了 相应 的 词类 码 。 
因此 有 可 能 出 现 语料库 中 分 词 系 统 切 分 出 来 的 词语 与 普通 用 户 输入 词语 不 一 致 的 情 
况 。 璧 如 假定 用 户 输入 字符 串 “ 中 国人 民 解 放 军 ,认定 这 是 一 个 词 ,因此 没有 以 空 
格 隔 开 。 而 在 语料库 中 , 串 “ 中 国人 民 解 放 军 ”实际 被 切 分 成 “中 国 _np AR n 解放 
军 _n” 等 三 个 “ 词 十 码 ” 的 子 申 拼接 形式 。 这 样 将 检索 不 到 用 户 希 望 得 到 的 句 对 。 
由 用 户 和 分 词 系统 对 词 的 认识 不 一 致 ,采用 字符 严格 匹配 的 方式 容易 导致 漏 检 。 

我 们 的 处 理 策 略 是 ,首先 将 查询 字符 串 拆 解 ,汉语 以 字 , 英 语 以 单词 为 基本 单 
位 ;对 各 基本 单位 后 采用 正则 表达 式 加 接 0 或 1 个 词类 编码 形式 ,构造 新 的 基本 单 
位 ;然后 再 拼接 各 基本 单位 构造 新 的 查询 表达 式 ,这 样 能 够 检索 得 到 与 原 查询 串 基 
本 单位 序列 相同 并 且 字 形 一 致 但 可 能 被 打 散 或 整合 的 汉语 句子 ,以 防止 对 分 词 理 
解 不 同 造成 的 漏 检 。 应 该 注意 的 是 ,这 种 处 理 也 有 可 能 误 检 出 基本 单位 字形 相同 
并 且 排列 相同 但 实际 并 非 用 户 希 望 检 出 的 句子 。 如 假定 要 检索 “华人 ”, 切 分 查询 
串 为 字 后 ,语料库 中 的 “中 华人 民 共 和 国 ” 将 被 检 出 。 因 此 模糊 检索 是 强调 检 出 率 
优先 的 可 靠 选 择 , 适 用 于 用 户 追 求全 面 结果 ,不 希望 有 任何 遗漏 ,然后 再 人 工 逐 一 
检查 这 样 一 种 后 处 理 。 

20.3.1.2 解决 英语 词语 匹配 不 一 致 的 词 形 还 原 

作为 一 种 形态 相对 比较 丰富 的 语言 ,英语 的 词 形变 化 可 能 导致 字符 串 匹 配 的 
困难 。 辟 如 可 数 名 词 有 单 复数 的 届 折 变化 ;动词 也 有 现在 分 词 . 过 去 分 词 及 过 去 完 
成 式 等 各 种 不 规则 变化 形式 。 因 此 ,对 用 户 输入 的 英语 查询 串 , 需 要 有 个 词 形 还 原 
形式 。 假 定 输入 的 是 词典 词 的 原型 形式 , 则 需 将 其 在 实际 文本 中 可 能 呈现 的 其 他 
屈折 变化 形式 都 能 检索 出 来 。 譬如 待 查询 的 是 原型 动词 “go”, 则 需要 将 实际 例句 
中 可 能 出 现 的 “went/gone” 等 其 他 变 体 形式 也 包罗 进来 。 

我 们 建造 了 一 个 包含 4 万 个 词语 及 其 相应 不 规则 形式 的 词 表 ,包括 词典 词 的 
原型 及 其 衍生 出 来 的 名 词 单 复数 .动词 时 态 还 有 形容 词 比 较 级 及 最 高 级 等 形态 变 
化 。 采 用 查 词 表 的 方式 对 输入 查询 串 中 的 英语 词 尝试 进行 扩展 。 其 中 新 扩展 的 词 
语 与 原 查询 串 中 的 原型 词 之 间 保留 逻辑 上 的 “或 "关系 , 即 在 语料库 的 句子 中 只 要 
能 找到 原 词 或 其 扩展 词 的 任意 其 一 ,都 将 视 作 对 查询 条 件 的 满足 。 


20.3.2 Web 和 桌面 应 用 程序 设计 


目前 我 们 实现 了 两 种 检索 方式 的 雏形 ,一 是 网 络 查询 ,是 桌面 查询 。 前 者 通过 
Web 浏览 器 联网 注册 成 为 用 户 后 ,登录 指定 网 站 ,根据 界面 指导 完成 查询 工作 ;后 
者 采用 光盘 将 系统 安装 在 用 户 计算 机 桌面 使 用 ,通过 用 户 图 形 界面 检索 。 
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网 络 版 检索 系统 在 后 台 选 用 开源 数据 库 MySQL 作为 语料库 的 管理 查询 工具 ， 
前 端 采用 脚本 语言 Php 制作 用 户 交互 式 的 Web 查询 界面 。 通 过 文本 框 接受 用 户 输 
入 ,下 拉 框 的 设计 用 来 接受 用 户 对 特定 属性 的 限制 ,构造 一 个 可 直接 对 数据 库 检索 的 
查询 语句 ,并 将 执行 结果 输出 到 用 户 浏览 器 页 面 。 其 中 用 户 指定 的 查询 词语 将 以 高 
亮 形式 凸显 。 这 是 典型 的 瘦 客 户 端 工作 方式 。 用 户 自身 的 计算 机 无 需 安装 特别 的 程 
序 或 其 他 系统 ,只 要 浏览 器 能 联网 就 能 访问 建 好 的 双语 对 应 语料库 系统 。 相 应 的 缺 
陷 是 对 服务 器 负担 较 重 ,如 果菜 一 时 段 的 并 发 访问 过 多 则 有 可 能 造成 服务 器 宕 机 ; 
另外 对 用 户 的 网 络 连 接 速 度 要 求 也 较 高 ,否则 有 可 能 因 访 问 超时 浏览 器 停止 工作 。 

至 于 单机 版 检索 系统 ,我 们 曾 在 项 目 组 内 部 采用 C# 和 媒人 式 数 据 库 Sqlite 
在 微软 DotNet Framework 平台 下 完成 了 一 个 集 语 料 校对 、 数 据 入 库 等 内 部 处 理 
和 查询 检索 等 外 部 工作 为 一 体 的 开发 平台 。 查 询 界面 与 Web 方式 基本 相同 ,也 是 
通过 文本 框 和 下 拉 框 实现 用 户 输入 查询 串 和 选择 元 属性 ,经 由 程序 将 用 户 输入 内 
容 翻译 为 等 价 SQL 命令 语句 ,将 结果 高 亮 呈 现在 浏览 器 webBrowser 控件 中 。 

图 20. 1 和 图 20. 2 分 别 显示 Web 和 桌面 应 用 下 的 查询 实例 。 其 中 ,Web 方 式 
显示 的 是 用 户 查询 “克服 困难 difficulty overcome”, 系统 设计 查询 串 的 所 有 原子 之 
间 缺 省 为 逻辑 “并 ”的 关系 ,因此 所 有 汉语 句子 带 有 “克服 困难 ”并 且 对 应 的 英文 句 
子 带 有 “overcome difficulty” 等 词 形 的 实例 将 作为 结果 输出 ,同时 这 些 查 询 词语 将 
高 亮 显 示 , 其 中 英语 词 可 能 的 其 他 变 体形 式 , 如 overcame 和 difficulties 等 视 作 查 
询 原 词 。 桌 面 应 用 程序 显示 的 是 用 户 查询 “克服 困难 -overcome difficulty”, 根 据 
系统 设计 前 加 “-” 的 查询 词语 被 视 作 排 除 词 ,将 被 过 滤 , 因 此 所 有 汉语 句子 含有 “ 克 
服 困难 ”而 相应 的 英文 句子 带 有 “difficulty”, 没 有 “overcome” 的 句 对 将 被 检索 出 
来 。 采 用 这 种 限制 方式 ,能 够 检索 出 汉语 “克服 困难 ”在 “困难 ”翻译 成 “difficulty” 
的 时 候 ,“ 克 服 ” 还 可 以 用 除 overcome 之 外 英语 翻译 。 


| 
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图 20.1 Web 方 式 用 户 查 询 
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图 2 


~ 


桌面 版 用 户 查 询 


20.4 汉 英 翻译 单位 的 对 应 检索 


在 将 句子 层面 的 对 齐 语料库 转换 为 数据 库 后 ,借助 用 户 图 形 界面 ,人 们 就 能 方 
便 地 利用 SQL 语言 进行 各 种 组 合 条 件 的 全 方面 查询 。 元 属性 的 限制 条 件 通常 是 
一 个 确定 值 或 多 个 确定 值 的 组 合 。 确 定 值 是 二 选 一 或 多 选 一 ,例如 翻译 对 的 属性 
值 是 { 英 译 汉 , 汉 译 英 } 取 其 一 ;时 代 属 性 值 是 {20 世纪 前 ,20 世纪 上 半期 ,20 世纪 
下 半期 } 取 其 一 。 对 语言 及 翻译 形式 的 检索 则 相对 复杂 。 

当前 针对 翻译 的 查询 方式 主要 有 两 种 :1) 语 言 学 意义 上 的 单 语词 或 词 与 码 的 
结合 ,如 检索 “研究 ”做 动词 和 名 词 翻译 成 英语 时 采用 什么 样 的 译 法 。2) 翻 译 研究 
意义 上 的 源 语言 和 目标 语言 之 间 的 对 应 单元 不 同 译 法 的 检索 , 辟 如 中 英文 词语 混 
合 检索 及 出 现 与 否 的 检索 。 

除了 一 些 固定 用 法 及 成 语 (idiom) 只 能 借助 词典 编码 外 ,大 多 数 翻译 是 按照 源 
语言 的 组 合 方式 ,在 目标 语言 中 将 与 源 语言 对 应 的 翻译 单位 重新 组 合 而 成 ,其 中 语 
法 (如 动 宾 关 系 ) 语 义 (如 施 事 受 事 关 系 ) 等 限制 条 件 保持 不 变 。 以 下 以 汉语 动 宾 结 
构 “ 克 服 困难 "为 例 介 绍 如 何 应 用 我 们 开发 的 检索 工具 ,在 英 译 汉 及 汉 译 英 的 翻译 
文本 中 检索 相关 的 语言 翻译 现象 ,现在 假定 对 文体 ,时 代 等 其 他 任何 元 属性 不 做 任 
何 限 制 。 语 料 规模 为 200 万 中 英文 字 词 。 

如 表 20. 3 所 示 ,利用 “克服 困难 ”进行 检索 ,可 以 检 出 汉语 语句 包含 “克服 困 
难 ” 的 英汉 名 对。 如 果 想 知道 “克服 困难 ”中 的 “困难 ”翻译 成 “difficulty” 的 例子 ,可 
采用 Al 的 检索 串 ; 想 知道 "克服 困难 ”中 “困难 ”翻译 成 非 “difficulty” 的 其 他 词语 ， 
采用 A2 的 检索 串 ; 如 果 要 检索 汉语 包含 “克服 困难 ”, 同 时 对 应 英文 词 分 别 翻 为 
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“overcome difficulty” 的 实例 ,用 All 串 ; 检 索 “ 克 服 困难 ”对 应 的 英语 词 为 非 
“overcome” 和 “difficulty” 的 实例 ,用 A12 串 。 检 出 的 相应 例句 数 参 见 频数 栏 , 频 数 
关系 满足 A=A1+A2;Al=Al1+Al12, 


表 20.2 利用 不 同 检索 字符 囊 确定 翻译 对 应 


检索 串 频数 汉 一 英 一 汉 

A 克服 困难 98 | 82:16 
Al 克服 困难 difficulty 86 76:10 

| Al | 克服 困难 overcome difficulty | 70 68:2 

A12 | 克服 困难 -overcome difficulty | 16 8:8 

A2 克服 困难 -difficulty [1s 66 

表 20.3 英语 译 词 的 选择 
es eee “克服 ” | “困难 ” 
| BRON) fila 翻译 实例 分 布 
ppm overcome (70) ,surmount/ | q | difficulty (76) .they/them (3). 
É insurmountable (7/4) «to do so (1) to do so (1) ,obstacles (2) 


overcome (4),@ (4), transcend (1), 
contend with (1), fought (1),get out 
of (1), struggle with (1), straighten 

out (1),master (1), vanquish (1), 


使 用 A 式 检索 ,在 本 章 实验 所 用 语 料 实际 得 到 100 条 记录 。 由 于 汉 英 句 对 都 
只 经 过 词类 赋 码 处 理 ,而 没有 句法 分 析 ; 当前 检索 对 象 只 是 在 一 个 句 对 范围 内 汉语 
同时 包含 “克服 困难 ”的 句子 ,不 可 避免 带 有 垃圾 。 辟 如 汉 英 “克服 投降 ,战胜 困 
难 ”中 “克服 “困难 ”就 在 一 句 范围 中 ,但 不 是 检索 所 要 的 “克服 困难 ”。 经 过 人 工 排 
查 过滤 , 最 终 满足 要 求 的 结果 数 为 98 Bil. 

从 表 20. 3 中 所 示 , 检 索 汉语 句子 包含 “克服 困难 "的 句 对 , 绝 大 多 数 是 汉 译 英 
文本 . 占 83%, 少 部 分 是 英 译 汉文 本 ,只 占 17%。 通 过 对 这 些 检索 出 来 的 例句 ,我 
们 至 少 能 够 发 现 如 下 现象 : 


20.4.1 汉 译 英 的 英文 句子 大 多 中 规 中 和 矩 


这 些 翻 译 句 对 的 文本 属性 多 数 是 政论 文体 。 将 “克服 "翻译 成 英语 时 , 主要 有 
两 种 译 法 ,分 别 是 “overcome”(70 例 , 占 85.4%) ,“surmount”(1] 例 , 占 13. 4%, 4 
含 四 例 “ 不 可 克服 ”译作 “insurmountable” 的 句子 )。 经 查询 汉 英 词典 ,“ 克 服 ”在 汉 


difficulty (10), OC(3), 
hardship (2) obstacles (1) 
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译 英 时 基本 上 是 取 其 高 频 对 应 词 而 成 0。“ 困 难 ” 的 翻译 也 基本 如 此 。 直 译 为 
“difficulty” # 76 例 , 占 总 数 的 92. 7% ;剩余 六 例 非 difficulty 的 翻译 实例 中 ,有 三 
例 是 采用 代词 “them” 或 “to”, 在 当前 英语 句子 中 找 不 到 相应 的 “困难 ” 译 词 ,存在 承 
前 省 略 现象 ; 另 有 两 例 翻译 作 “obstacle”, 如 “克服 暂时 的 困难 /surmount the 
temporary obstacles”“ 克 服 自 己 道路 上 的 各 种 困难 /surmount all the obstacles in 
__ their path”, 形 成 surmount # obstacle 的 搭配 。 
利用 “Google 翻译 ”来 验证 “克服 困难 ”的 英 译 @, 其 “翻译 :汉语 六 英语 ?栏目 结 
果 正 是 “to overcome difficulties”; 而 “字典 :” 栏 目 显示 的 是 “surmount difficulties”, 
用 “雅虎 翻译 ”来 翻译 “克服 困难 ”, 结 果 是 “overcomes difficulties”。 这 与 我 们 从 
汉 译 英语 料 中 观察 到 的 结果 相 一 致 。 

按照 汉语 动 宾 关系 的 实现 模式 ,根据 词典 释义 词 或 词 表 对 译 词 直接 套用 生成 
英语 译文 ,是 忠实 原文 的 表现 ;同时 间接 反映 出 作为 外 语 ,中 国 译 者 的 语言 表达 的 
丰富 性 还 是 比较 欠缺 。 


20.4.2 英 译 汉 的 实例 较 少 ,用 词 丰富 


从 英语 翻译 成 汉语 ,可 理解 成 两 个 连续 的 过 程 :其 一 是 根据 英语 形式 理解 其 意 
思 , 这 是 个 从 形式 到 意义 的 语言 分 析 (analysis) 过 程 ;其 二 是 将 该 意思 以 汉语 表述 
出 来 ,这 是 个 从 意义 到 形式 的 汉语 生成 (generation) 过 程 。 由 于 有 不 同 句 式 及 词汇 
层面 的 不 同 表述 方式 ,因此 在 反映 “用 坚强 的 意志 和 力量 战胜 (困难 )” 这 一 意义 时 ， 
在 汉语 中 分 别 有 “ 战 胜 ”“ 克 服 ”“ 跨 越 ” 等 多 个 不 同 的 同 义 或 近义词 语 可 以 用 来 表 
述 。 由 于 有 更 多 的 可 选 词语 竞争 ,因此 能 够 完全 匹配 “克服 困难 ”这 四 个 字 的 汉语 
译文 自然 就 相对 较 少 。 

同时 还 要 看 到 ,在 英语 中 ,可 以 用 来 表达 类 似 “ 用 坚强 的 意志 和 力量 战胜 ( 困 
难 )” 意 义 的 词 或 短语 也 有 不 少 。 壁 如 在 WordNet 中 与 该 意义 等 值 的 “deal with 
successfully” 的 同义词 集 就 有 “overcome, subdue, surmount, master” 等 词 ,如 果 再 
扩展 一 下 ,加 入 近 义 或 类 义 表示 ,那么 可 选 的 表达 方式 就 很 可 观 了 。 在 英 译 汉 的 文 
本 中 ,母语 为 英语 的 作者 可 以 选用 最 贴切 的 表述 方式 ,而 不 管 采 用 词语 或 是 短语 形 
式 实现 。 这 使 得 英语 表达 更 丰富 ,除了 可 以 见 诸 词典 的 常规 表示 ,还 有 更 多 基于 上 


O “克服 "根据 (远东 汉 英 大 辞典 X《 张 芳 杰 主编 ,新 华 出 版 社 /远东 图 书 公司 ,1994) 第 一 个 
义 项 为 to overcome (difficulties,etc);《 现 代 汉 英 词典 )( 本 社 词典 编辑 室 , 外 语 教学 与 研究 出 版 
社 ,1988) 第 一 个 义 项 为 (战胜 ) surmount; overcome; conquer. 

@ http: // translate. google. cn/translate_t7q 二 克服 困难 #zh-CN|en| 克 服 困 难 

图 http://fanyi. cn. yahoo. com/translate_txt 
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下 文 的 一 次 性 用 法 。 

在 82 个 汉 译 英 “ 克 服 ” 实 例 , 翻译 后 的 英语 句子 中 只 有 三 个 不 同 词 形 翻译 
(surmount 与 insurmountable WEA), ii RA 16 个 英 译 汉 的 实例 却 有 十 个 不 
同 英语 词 形 。“ 困 难 ” 的 翻译 在 汉 译 英 及 英 译 汉 都 只 有 四 种 不 同 词 形 。 由 此 看 出 ， 
英 译 汉 实例 中 的 意义 表述 用 语 比较 发 散 ,而 且 有 相当 数量 的 短语 形式 ,如 contend 
with, get out of, struggle with, straighten out 等 。 与 汉 译 英 的 英语 用 词 较 集中 ,可 
预测 性 较 强 相 比 , 英 译 汉 中 的 英语 表述 更 加 自然 地 道 , 需 要 特别 学 习 。 


20.4.3 ” 英 译 汉 有 增 译 现象 


对 “克服 困难 ”的 汉 译 英文 本 基本 上 没有 发 现 漏 译 的 情况 ,这 可 能 与 其 多 数 是 
政论 文体 有 关 。 一 般 而 言 ,对 政论 文体 的 翻译 相对 正式 。 辟 如 一 些 重要 决议 .领导 
人 的 汉语 著作 都 是 久 经 锤炼 的 经 典 ,为 保证 译文 的 准确 达意 ,对 这 些 文本 的 翻译 通 
常 都 没有 删 碱 。 而 在 英 译 汉文 本 中 “克服 困难 ”发 现 有 四 处 增 译 ,它们 都 不 是 像 汉 
译 英 那 样 的 政论 文本 。 具 体 实例 见 下 : 


D 即使 当时 医生 要 克服 的 困难 比 现在 还 要 大 得 多 ,在 他 那 坚持 不 懈 的 
努力 之 下 困难 也 是 会 退让 的 。Greater things than the Doctor had at that 
time to contend with, would have yielded before his persevering purpose. 

(2) 要 是 她 能 够 克服 这 一 切 困难 到 达 爱 伦 身边 , 那 就 好 了 ! If she could 
only win to Ellen! 

(3) 这 种 努力 非常 闫 强 , 大 家 全 力 以 赴 ,痛苦 不 堪 地 克服 困难 , 才 把 它 压 
了 下 去 。tried so hard that it was only kept under with great and painful 
difficulty; 

(4)“ 那 少年 是 克服 了 最 大 的 困难 才 集中 了 全 身 的 力量 说 出 话 来 的 ,但 是 
他 的 神色 却 起 着 可 怕 的 强调 作用 。?It was with the greatest difficulty that the 
boy gathered bodily force to speak; But，his spirit spoke with a dreadful 


emphasis. 


其 中 , 例 (1) 英 语 原文 是 “thing( 事 情 )”, 译 成 汉语 时 ,根据 与 其 构成 动 宾 关 系 
的 动词 短语 contend with 具有 “对 付 困 难 或 不 愉快 事情 ?9 意义 ,而 将 “事情 ?具体 
化 汉 译 为 带 有 不 好 意味 的 “困难 ”。 例 (2) 是 完全 增 译 ,原文 只 是 一 句 简 短 表示 虚拟 


© 根据 Longman Dictionary of Contemporary English 对 contend with 的 解释 为 to have to 
deal with something difficult or unpleasant, 
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语气 的 感叹 句 ,经 过 翻译 使 “赢得 爱 伦 ”需要 花费 很 大 精力 才能 完成 这 种 艰辛 变 得 
更 为 凸显 。 而 例 (3) (4) 增 译 了 “克服 ”, 原 文中 并 没有 突出 “克服 ”, 只 是 强调 了 “把 
它 压 下 去 ”和 “说 出 话 来 "具有 一 定 的 难度 ,间接 表明 要 完成 这 些 事情 需要 有 一 些 特 
别 的 处 理 , 因 而 汉 译 中 加 译 了 对 困难 的 处 理 一 一 克服 ?这 一 原本 没有 的 译文 。 


20.5 小 结 


在 规划 建设 语料库 的 数据 库 结构 并 建成 较 大 规模 的 汉 英 对 应 语料库 之 后 ,我 
们 着 手 为 广大 用 户 提供 简单 方便 的 访问 手段 。 通 过 良好 的 用 户 界 面 ,生成 合适 的 
数据 库 查询 语句 ,使 得 翻译 研究 和 学 习 者 无 需 掌握 复杂 的 查询 指令 和 更 多 的 计算 
机 操作 技能 ,就 能 及 时 方便 地 利用 经 过 语言 学 家 和 翻译 学 家 精心 整理 加 工 的 双语 
对 应 语料库 。 

当前 检索 系统 能 够 进行 语言 学 的 特定 词 与 词类 查询 ,能 够 实现 英汉 汉 英 双向 
的 翻译 单位 检 出 ,能 够 满足 元 属性 不 同 限制 条 件 的 混合 检索 。 输 出 结果 保存 为 
HTML 格式 ,查询 词语 高 亮 显 示 , 方 便 对 结果 集 的 二 次 检索 和 对 结果 的 显 家 观察。 

限于 现 有 加 工 处 理 深度 ,当前 采用 检索 词语 句 间 共 现 作为 例句 检 出 的 依据 ,在 
召回 率 (recall rate) 得 以 保证 的 情况 下 ,准确 率 (precision rate) 将 受到 一 定 影响 。 
虽然 为 人 工 翻译 研究 与 教学 服务 的 检索 系统 由 于 有 人 工 参 与 ,优先 考虑 召回 率 ,可 
以 考虑 引信 浅 层 语法 分 析 , 适 当 增加 准确 率 的 选项 。 另 外 系统 现在 还 是 采用 查询 
词语 出 现 与 不 出 现 的 布尔 查询 模式 ,今后 可 以 适当 借鉴 基于 内 容 的 信息 检索 向 量 
空间 等 模式 ,实现 近似 句 的 查找 。 


第 21 章 


语料库 辅助 翻译 功能 探讨 


本 章 旨 在 比较 机 器 翻译 软件 和 翻译 记忆 软件 对 翻译 的 辅助 作用 ,探讨 语料库 
尤其 是 汉 英 对 应 语料库 在 英汉 翻译 中 的 使 用 方式 ,用 途 和 独特 优势 。 研 究 认为 , 双 
语 对 应 语料库 能 提供 针对 性 较 强 的 参考 译文 ,能 够 实施 英 - 汉 和 汉 - 英 双向 检索 ,还 
能 通过 提供 更 大 语 境 或 者 复合 检索 为 翻译 提供 丰富 的 参考 资源 。 可 以 让 译 者 充分 
利用 各 种 潜能 高 效 高 质地 完成 翻译 任务 。 汉 英 双 语 对 应 语料库 能 够 成 为 功能 强大 
的 机 助 翻译 工具 。 


21.1 引言 


在 信息 技术 高 度 发 达 的 今天 , 凡 与 翻译 相关 的 各 种 活动 都 要 使 用 电脑 或 网 络 
资源 ,各 种 电子 资源 和 工具 (电子 词典 、 翻 译 辅助 软件 和 网 络 资源 ) 正 广泛 应 用 于 翻 
译 活动 。 半 个 多 世纪 以 前 ,人 们 对 机 器 翻译 (MT) 寄 予 厚望 ,希望 它 能 够 借 重信 息 
技术 提供 的 各 种 潜力 成 就 高 质量 的 翻译 ,但 机 器 翻译 至 今 (在 英汉 语 之 间 ) 还 未 开 
发 成 真正 可 靠 的 翻译 工具 。 自 20 世纪 90 年 代 以 来 ,机 辅 翻译 (CAT) 工 具 蓬勃 发 
展 , 有 许多 翻译 记忆 (TM) 软 件 相继 得 到 开发 和 应 用 。 此 外 ,一 些 在 线 双语 对 译 检 
索 系 统 也 出 现在 互联 网 上 .展现 出 良好 的 应 用 前 景 。 

与 此 同时 ,语料库 的 发 展 和 应 用 给 机 辅 翻 译注 人 了 新 的 活力 。 近 20 年 来 , 随 
着 各 种 语料库 的 创建 和 应 用 ,双语 语料库 正 以 其 独特 的 方式 进入 人 们 的 视野 ,其 畏 
助 功能 日 益 凸 显 。 本 章 以 北京 外 国语 大 学 汉 英 对 应 语料库 (CEPC) 为 例 对 比 语 料 
库 与 其 他 翻译 辅助 工具 在 翻译 实务 上 的 用 途 , 重 点 探讨 CEPC 的 翻译 辅助 功能 。 


21.2 机 辅 翻 译 工 具 的 类 型 和 特点 


信息 技术 发 展 到 今天 ,联网 计算 机 犹如 一 个 工作 间 , 可 以 从 那里 存 贮 和 调用 翻 
译 所 需 的 各 种 资源 ,其 数量 、 类 型 .内 容 及 获取 速度 远 胜 过 其 他 传统 资源 。 除 了 电 
子 词典 和 搜索 引擎 外 ,目前 常用 的 英汉 机 辅 翻 译 工具 软件 还 有 四 类 :机 器 翻译 软 
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件 、 翻 译 记 忆 软 件 、 双 语 对 译 句 搜索 引擎 、 双 语 对 应 语料库 。 这 些 软 件 对 翻译 都 有 
辅助 作用 ,但 辅助 方式 不 同 ,作用 各 异 , 这 是 本 章 探讨 问题 。 


21.2.1 机 器 翻译 软件 (machine translaiton) 


机 器 翻译 软件 很 多 ,常见 的 在 线 工 具有 Babylon Pro、 华 建 翻译 .Google 翻译 
工具 、Free Online Language Translator, Babel Fish、Yahoo、 有 道 ,等 等 。 这 些 软 件 
都 能 产 出 完整 的 译文 ,但 译文 质量 较 低 。 表 现在 以 下 几 个 方面 : 

第 一 ,一 次 只 提供 一 种 译文 。 如 果 不 同 软件 给 出 的 译文 不 一 致 , 译 者 难以 做 出 
选择 。 例 如 “垃圾 邮件 ” 既 对 应 spam (Google) ,又 对 应 junk mail( 华 建 /Yahoo/ 
Worldlingo) 。“ 体 制 改革 ”里 的 “体制 ”对 应 institutional(Babylon,Google) , system 
( 华 建 /有 道 ) 和 organizational(Worldlingo、Yahoo) 。 究 竟 该 选用 哪个 ?软件 本 身 
无 法 提供 更 多 的 信息 ,这 时 机 器 翻译 对 译 者 助 益 不 大 。 

第 二 , 词 库 更 新 不 够 及 时 。 一 些 较 新 的 词语 组 合 找 不 到 合适 的 译文 ,如 , “山寨 
( 手 ) 机 ”有 多 个 应 词 :Mountain fastness machine( 华 建 )、Village in a mountainous 
area machine(Yahoo) 以 及 “山寨 machine”(Google) 。 而 “群体 事件 ”的 翻译 更 是 鱼 
龙 混杂 ,有 groups events, colony incident, mass incidents, community event。 没 有 
其 他 信息 做 参照 , 面 对 这 么 多 对 应 词 , 译 者 无 所 适 从 。( 这 一 点 从 叙述 上 来 说 也 属 
于 “多 个 译文 ,难以 取决 ” 吧 ?) 

第 三 ,难以 处 理 结构 较 复 杂 的 汉语 表达 形式 。 比 如 ,有 的 软件 在 翻译 “踩踏 事 
件 ” 时 只 是 根据 原文 将 词 机 械 拼凑 起 来 的 ,加 上 冠 词 ,如 trample the incident, steps 
on the event。 译 文 合乎 语法 ,但 没有 意义 。 再 如 ,在 处 理 “ 你 真 记性 坏 ” 这 个 句子 
时 ,出 现下 面 两 种 译文 : 


a. you really bad memory. (Babylon/Google) 
b. Your real memory is bad.( 华 建 /Wordlingo/Yahoo) 


“你 真 记性 坏 ” 这 个 句子 的 特点 是 :小 句 主语 (记性 ) 隶 属于 大 名 主语 代表 的 事 
物 (你 )。 句 b 显示 ,软件 翻译 能 通过 语义 运算 识别 出 “记性 ”和 “你 ”之 间 的 关系 ,但 
不 能 处 理 好 副词 * 真 "。 而 能 处 理 副词 真 ” 的 a 句 却 不 能 处 理 好 “记性 ”和 “你 ”的 隶属 
关系 。 可 见 , 机 器 翻译 对 于 汉语 句法 关系 的 判断 能 力 还 是 较 弱 ,语义 运算 能 力 有 限 。 

第 四 ,语序 调整 能 力 差 ,对 于 汉语 话题 句 的 处 理 能 力 很 低 。 比 如 , “无 线 电 我 是 
门外汉 ”是 汉语 常见 的 话题 句 ,大 句 主 语 (无 线 电 ) 前 边 隐 合 “对 于 、 关 于 ”的 意思 。 
英语 没有 这 种 句 式 ,翻译 时 要 做 出 添加 或 者 请 整 。 但 现 有 的 机 器 翻译 软件 均 无 法 
对 此 做 出 恰当 的 调整 ,于 是 产生 下 面 的 译文 : 
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a. Radio I am a layman. (Babylon/Worldlingo/Yahoo) 
b. Radio I layman. (Œ) 
c. Iam a layman radio. (Google) 


简 言 之 , 现 有 的 翻译 软件 主要 靠 词 对 应 实施 翻译 ,内 容 更 新 不 及 时 ,语义 运算 
能 力 差 ,句法 识别 和 转换 能 力 有 限 。 机 器 翻译 主要 关注 源 语 ,而 人 工 翻译 的 目标 是 
理解 目的 语 ,所 以 前 者 译文 自然 难以 准确 。 正 如 冯 志 伟 (1996:424) 所 言 ,机 器 翻译 
软件 对 于 一 些 复杂 的 句子 的 分 析 依然 很 困难 ,多 义 词 和 歧 异 问题 尚未 找到 切实 有 
效 的 解决 办 法 。 


21.2.2 翻译 记忆 软件 (translation memory) 


面 对 机 器 翻译 难以 逾越 的 语义 瓶颈 ,美国 政府 曾 责成 ALPAC 于 1966 年 对 这 
类 系统 进行 评估 ,结果 显示 ,机 器 翻译 速度 慢 、 效 率 低 , 比 人 工 翻 译 贵 一 倍 ,所 以 ,这 
类 软件 的 开发 得 不 偿 失 (Craciunescu 2004) 。 在 沉寂 了 多 年 之 后 ,从 20 世纪 90 年 
代 开 始 , 机 器 翻译 领域 发 生 了 重大 转向 :从 基于 语法 规则 的 翻译 转变 为 基于 翻译 实 
例 的 翻译 ,翻译 记忆 的 设计 理念 应 时 而 生 。 人 们 对 基于 翻译 实例 的 翻译 记忆 工具 
兴趣 渐 浓 ,可 以 想见 , 若 能 将 由 语料库 转化 而 成 的 语言 知识 库 同 基于 规则 的 机 器 翻 
译 结合 起 来 ,机 辅 翻译 前 景 光 明 (Bernardini et al 2003:3) 。 

目前 ,不 少 翻译 记忆 软件 已 具备 商业 用 途 ,如 Déjà Vu 和 Trados, 还 有 我 国 的 
雅信 CAT。 这 类 软件 具有 自动 记忆 和 匹配 功能 ,可 根据 译 者 需要 自行 建 库 , 还 可 
以 有 效 地 进行 术语 管理 ,确保 科技 翻译 中 术语 一 致 。 另 外 ,此 类 软件 能 实施 多 语种 
双向 互 译 。 现 以 Trados 为 例 考 察 它 的 检索 功能 。 

Trados 翻译 记忆 软件 的 检索 功能 和 在 线 对 译 句 检索 程序 工作 机 制 相似 , 它 能 
建立 句 库 , 可 以 帮助 使 用 者 有 效 地 应 对 专业 翻译 。 例 如 ,从 我 们 建立 的 Trados 句 
对 齐 库 中 可 以 检索 到 “垃圾 邮件 ”的 两 个 对 应 项 ( 见 图 21. 1) 。 


图 21.1 Trados 的 检索 结果 
要 像 普 通 对 译名 检索 那样 提供 丰富 的 对 译 ,翻译 记忆 软件 就 需 建立 相当 规模 
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的 名 库 。 但 对 于 个 体 译 者 而 言 ,限于 时 间 、 精 力 和 经 济 条 件 , 大 规模 建 库 不 太 现实 。 
但 不 管 怎么 说 ,翻译 记忆 软件 有 助 于 提高 翻译 质量 和 效率 ,特别 适合 专业 文献 
翻译 。 

21.2.3 ”在线 英汉 双语 对 译 句子 检索 平台 


汉 英 在 线 双 语 对 译 句子 检索 工具 出 现时 间 不 长 ,近来 比较 活跃 的 有 句 酷 、 金 山 
爱 词霸 和 融合 句 酷 及 网 络 释义 的 灵 格 斯 对 译 句 搜索 引擎 。 支 持 这 些 在 线 工 具 的 句 
库 已 具备 相当 规模 , 且 检 索 方便 。 此 类 工具 的 辅助 能 力 表现 在 以 下 几 个 方面 。 

第 一 ,一 次 能 检索 到 例证 的 丰富 。 例 如 ,“ 群 体 事件 "但 在 灵 格 斯 中 有 很 多 在 句子 
中 出 现 的 对 应 项 ,有 mass incident/event/disturbance; group affair/event/accident; 
colony event, 甚至 还 有 mass emergency。 这 显然 要 比 机 器 翻译 能 提供 更 多 的 选 
择 ,只 是 对 应 项 太 多 ,也 不 容易 做 出 选择 。 

第 二 ,多 源 检索 和 呈现 。 现 有 的 许多 在 线 句 对 译 搜索 工具 附 有 词典 或 百科 搜 
索 , 有 时 有 较 高 的 参考 价值 。 例 如 , 爱 词霸 附带 的 “百科 ”搜索 显示 ,山寨 机 ”的 英 
文 翻译 是 emulational mobile phone。 虽 然 我 们 还 无 法 确认 这 样 翻译 是 否 合适 ,但 
至 少 在 意思 上 说 得 通 。 

第 三 ,有 时 也 能 检索 到 比较 可 靠 的 译文 。 如 “踩踏 事件 ”在 灵 格 斯 ( 句 酷 ) 和 爱 
词霸 百科 中 均 发 现 对 应 项 “stampede”。 甚 至 还 有 对 译 句 , 如 ， 


Higher inflation has recently triggered popular reaction in Asia ranging 
from factory strikes in Vietnam to stampedes for discounted items at some 
Chinese supermarkets. 

近来 ,通胀 加 剧 已 在 亚洲 引发 普遍 反应 ,例如 从 越南 的 工厂 罢工 ,到 中 国 
一 些 超市 促销 引发 的 踩踏 事件 等 。 


第 四 ,在 句子 层面 上 ,译文 的 参照 价值 高 。 如 :“ 我 真 记 人 性 坏 。.” 就 碰巧 遇 到 非常 
相近 的 句子 ; 


My memory is really dreadful—manager’s daughter?”( 句 酷 . 灵 格 斯 ) 
我 记性 真 坏 一 一 经 理 的 小 姐 ?” 


有 些 译文 提供 的 翻译 方式 还 相当 丰富 ,完全 可 以 帮助 我 们 产 出 高 质量 的 译文 。 
这 是 机 器 翻译 软件 难以 企及 的 。 如 “无 线 电 我 是 门外汉 。” 可 以 有 很 多 值得 参照 的 
对 译 词 和 句子 结构 。 
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When it comes to mathematics, I’m completely at sea. ( 句 酷 \ 爱 词 戎 ) 
说 到 数学 ,我 完全 是 门外汉 。 

Where the law is concerned, I am only a layman. ( 句 酷 、 灵 格 斯 ) 

谈 到 法 律 ,我 不 过 是 门外汉 。 

All that form of life was outside him. ( 灵 格 斯 ) 

对 于 那 种 生活 方式 ,他 全 然 是 个 门外汉 。 


有 些 译文 大 同 小 异 ,甚至 可 以 直接 使 用 现成 的 翻译 。 如 “你 这 种 事 做 不 得 。 可 
以 直接 得 到 下 面 的 译文 : 


You must never do this, (Jif) 
这 件 事 你 做 不 得 。 

You must not do it. ( 句 酷 ) 

你 不 得 做 这 件 事 。 


尽管 如 此 ,对 译名 检索 平台 的 辅助 功能 还 是 十 分 有 限 。 首 先 , 语 境 信息 不 够 充 
分 ,只 考察 句子 对 译 不 足以 应 对 各 种 复杂 的 情形 。 其 次 , 现 有 对 译 句 检索 平台 没有 
系统 地 区 分 源 语 和 目的 语 ,对 译 成 分 的 选择 比较 盲目 ,难以 保证 译文 地 道 。 再 次 ， 
对 译 句 只 是 陈列 多 个 译 句 ,难以 考察 影响 语言 运用 的 其 他 因素 (如 语 域 ,文体 ,搭配 
能 力 等 ) 。 

另外 , 现 有 的 对 译 句 检索 多 来 自 双 语词 典 中 的 例句 , 语 料 来 源 不 丰富 ,软件 使 
用 的 词典 有 很 多 雷同 。 而 且 ,受制 于 语料库 规模 , 供 检索 的 内 容 有 限 。 例 如 ， 垃 圾 
邮件 ”在 句 酷 和 灵 格 斯 上 有 两 个 对 应 项 :junk mail 和 spam。 该 选用 其 中 的 哪个 ? 
我 们 心里 还 是 没 底 。 


21.3 双语 对 应 语料库 辅助 翻译 


现 有 的 在 线 翻 译 辅助 资源 只 是 句 对 齐 文本 ,没有 更 大 的 语 境 参照 ,也 没有 进行 
语法 或 其 他 功能 标注 。 而 且 , 现 有 的 句 对 齐 检索 仅 能 显示 非常 第 统 的 元 信息 
CMetainformation, 如 该 名 来 自 “ 词 典 "或 来 自 “ 网 友 提供 ”) ,参考 信息 不 充分 。 在 
检索 功能 上 ,翻译 记忆 工具 虽 能 提供 词 精确 和 模糊 检索 ,但 不 能 进行 词性 检索 ,更 
不 能 检索 到 翻译 方向 ,文体 等 重要 信息 。 

要 避免 上 述 问题 ,双语 对 应 语料库 是 一 个 很 好 选择 。 北 京 外 国语 大 学 的 汉 英 
对 应 语料库 (CEPC) 创 建 于 2004 年 ,该 语料库 语 料 规模 还 在 不 断 扩充 之 中 。 其 主 
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要 特点 是 :1) 语 料 规模 大 ,目前 的 可 检索 语 料 达 2 000 万 字 词 ,检索 内 容 丰富 。2) 汉 
英 双向 , 既 有 汉 英 翻译 语 料 ,又 有 英汉 翻译 语 料 。3) 语 料 制作 过 程 复杂 ,涉及 名 对 
齐 ,xml 编码 ,有 用 的 元 信息 和 英汉 语词 性 标注 。4) 分 类 细致, 有 题材 、 语 域 . 翻 译 
时 间 等 详细 的 分 类 。5) 检 索 方 式 多 样 , 既 有 可 分 类 的 在 线 检索 ,又 有 较 复 杂 的 研究 
用 检索 。 

对 应 语料库 已 广泛 应 用 于 翻译 研究 ,但 有 关 它 在 翻译 实践 上 的 应 用 研究 还 很 
少 , 有 关 使 用 者 如 何 有 效 使 用 该 类 语料库 的 研究 更 少 (Santos & Frankenberg- 
Garcia 2007)。 所 以 ,有 必要 介绍 汉 英 对 应 语料库 在 翻译 中 可 能 的 用 途 和 应 用 
方式 。 


21.3.1 参考 译文 针对 性 强 


CEPC 可 以 根据 词汇 使 用 的 语 域 和 语 境 检索 对 应 词 。 例 如 ,在 “只 要 不 动摇 、 
不 懈 息 .不 折腾 ”中 “折腾 ”并 不 指 具 体 的 动作 ,而 是 一 类 社会 现象 。 从 其 他 资源 中 
得 到 的 多 是 具体 的 动作 ,如 “turn from side to side, toss, do something again and 
again”, {Ae CEPC 中 ,可 以 检索 到 更 有 针对 性 的 例证 。 如 : 


(1) 如 果 搞 资产 阶级 自由 化 ,就 是 再 来 一 次 [折腾 ]( 汉 英 : 非 文学 ) 

Bourgeois liberalization would plunge the country into turmoil once 
more, 

(2) 因为 中 国 不 能 再 [折腾 ], 不 能 再 动荡 ( 汉 英 : 非 文学 ) 

Because China could not afford any more disorder or unrest. 

(3) AABEA AAI ARE STB T GEN: x) 

For Sally was crumbling, 

(4) 在 自己 的 宅 子 里 头 频 [折腾 ]( 英 汉 : 文 学 ) 


defiling his own palace with it; 
不 难看 出 ,作为 一 种 社会 行为 的 “折腾 ”在 英语 里 的 对 译 可 以 是 plunge. . . into 
turmoil 或 者 disorder。 
21.3.2 双向 检索 例证 


双向 检索 指 可 以 根据 不 同 的 源 语 和 目的 语 关系 检索 例证 ,好 处 是 多 向 验证 。 
例如 ,我 真 记 性 坏 ” 的 英 译 可 以 从 汉 英和 英汉 两 个 方向 寻找 翻译 对 应 项 ,这 样 有 望 
检索 到 适 切 的 对 应 词 或 对 应 结构 。 
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(5) 我 记性 真 坏 一 一 经 理 的 小 姐 ? CRE) 

My memory is really dreadful—manager’s daughter? 

(6) 文 纳 ,你 记性 真 好 ! 〈 汉 英 7 

What a good memory you have, Wen-wan! 

You’ ve neither sense nor memory, and I leave it to fancy where your 
mothers was that let you come to sea. (英汉 ) 

(7) 你 们 既 没有 头脑 也 没有 记性 ,我 真 不 明白 你 们 的 母亲 怎么 会 让 你 们 
出 海 。 

I think his extra word “VERY” stands explained: it is attributable to a 
defect of memory, (英汉 ) 

这 多 出 来 的 一 个 字 就 已 经 说 明 问题 :这 是 因为 [记性 ] 差 了 那么 一 点 儿 。 


通过 英汉 翻译 ,我 们 可 以 确定 memory 对 应 “记性 ”; 通过 汉 英 翻译 ,我 们 可 以 
确认 “你 真 记性 坏 ” 可 能 使 用 you really have [...], 或 者 how adj. [...] R# 
what a... 结构 形式 , 据 此 可 形成 下 面 的 译文 ;You really have a bad memory. / 
How bad your memory is! /What a bad memory you have. 


21.3.3 提供 更 地 道 的 译文 


根据 ( 秦 洪 武 . 王 克 非 2004, 2009) ,英汉 翻译 时 , 译 者 会 过 度 使 用 汉语 里 的 某 
一 表达 式 或 者 结构 来 翻译 英语 里 的 某 类 表达 式 。 如 过 度 使 用 汉语 数量 短语 “这 种 、 
这 一 、 这 个 ”来 翻译 英语 指示 代词 this/such。 实 际 上 ,“ 这 种 ”在 汉语 里 用 得 不 多 ， 
且 与 之 共 现 的 词 项 有 时 有 贬义 。 英 译 汉 时 过 度 使 用 这 个 短语 是 受 英语 影响 造成 
的 。 要 选择 多 样 的 表达 , 译 者 可 以 检索 汉 英 翻译 库 中 检索 this/such 的 汉语 对 译 
文 , 这 可 能 找到 更 符合 汉语 表达 习惯 的 处 理 方式 。 


(8) 我 们 要 抓 住 时 机 ,现在 是 改革 的 最 好 时 机 
We must seize [ this ] highly opportune moment for reform 


(9) 又 是 范 博文 的 刻薄 的 声调 

[This] was another cut from Fan Po-wen 

(10) 这 么 ,我 们 公司 眼前 既 有 事业 好 做 ,将 来 “东方 大 港 ” 之 类 完成 了 的 
时 候 ,我 们 的 事业 就 更 多 了 

In [this] way, we’ll have something solid to get on with, and then one 
day, when the “Great Eastern Harbour” and so on have been completed, 


we’ ll be able to expand even more 
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(11) 这 样 做 不 会 也 不 可 能 破坏 社会 主义 经 济 


[This] cannot and will not undermine the socialist economy 


由 此 反 推 ,英语 里 好 多 使 用 指示 (如 this, that,such) 的 地 方 在 译 成 汉语 时 不 需 
要 任何 指示 语 ; 而 且 ,“ 这 么 ”“ 这 样 做 ”、“ 此 ”都 可 能 对 应 this。 总 之 , 译 者 通过 观 
察 这 类 语 料 反思 自己 的 翻译 行为 ( 王 克 非 \ 秦 洪武 2007; 秦 洪武 . 王 克 非 2007) , 避 
免 在 翻译 时 过 度 使 用 “这 种 ”。 


21.3.4 提供 更 多 的 语 境 信息 


使 用 较 大 的 语 境 有 助 于 我 们 和 弄 清 一 个 词 在 具体 语 境 下 的 用 法 ,以 及 这 些 用 法 
的 语 用 含义 。 根 据 语 境 , 第 一 个 例证 里 的 “外 行 " 有 自 谦 的 口吻 ,而 第 二 个 例证 里 有 
调侃 他 人 的 意味 。 这 些 信息 在 翻译 时 很 好 的 参照 作用 ( 见 图 21. 2) 。 

SRUNEMASA LAK? fou take a scholarly interest in Newspeak, | believe?” 


R 
cree 部 分 自信 iston had recovered part of his selfpossession * 
a bit at R LE “he sald. 


21.2 ”相关 检索 结果 


CEPC 还 可 以 使 用 通配符 检索 、 词 性 检索 ,并 提供 检索 词 的 搭配 信息 ,其 他 检 
索 工 具 都 不 能 实施 此 类 检索 。 这 些 检索 能 够 从 多 个 角度 确定 一 个 词 的 用 法 。 


21.3.5 复合 检索 功能 
复合 检索 功能 即 运用 语 料 提供 的 元 信息 ,使 用 多 个 检索 限制 条 件 提取 译 者 需 


要 的 信息 。CEPC 目前 推出 的 在 线 检索 程序 (《“ 中 英 双 语 在 线 ”) 能 够 实施 此 类 检 
索 。 检 索 方式 见 图 21. 3。 


z EN aos = en ae we oe 


图 21. 3 CEPC 检索 方式 


图 21. 3 显示 ,在 线 检索 系统 可 以 执行 严格 匹配 和 模糊 匹配 ,模糊 匹配 有 助 于 
许多 结构 式 的 检索 。 更 重要 的 是 ,该 检索 系统 较 完整 地 实施 了 复合 检索 :如 源 语 设 
定 (英语 或 者 汉语 ) 、 类 型 选择 (有 文学 和 非 文学 )、 领 域 区 分 (文学 ,人 文 、 社 科 、 自 
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然 ) 文体 分 类 ,等 等 。 例 如 , 若 设 定 了 检索 条 件 , 可 得 到 “与 其 …… 不 如 ”的 索引 项 
AM 21. 4) 。 


| 中 英 双 语 在 线 Chinese-English Online (CEO) 
panman Contact: ceoprojectostaa com (RITESH REE x08 100%) 


1 ARA et j [oe formu 
A tke iterestfickered in Pork 5 eyes os he blew nis nose loudly but R was more pomene than interest 


图 21.4 “与 其 …… 不 如 "的 索引 项 


检索 结果 显示 ,在 20 世纪 上 半期 的 英汉 翻译 里 ,对 应 英语 rather... than/ 
more adj. ... than/not as adj. as 的 很 少 使 用 “与 其 …… 不 如 ”( 一 次 ); 而 在 20 世 
纪 后 半期 的 英汉 翻译 中 , 则 出 现 了 五 次 。 而 汉语 原创 语言 中 这 类 结构 没有 出 现 。 
看 来 ,现代 汉语 有 更 灵活 的 方式 来 表达 “与 其 不 如 ”的 意思 。 这 时 可 以 非常 方便 地 
检索 源 语言 为 汉语 的 子 库 , 我 们 可 以 检索 到 对 应 目的 语 英语 rather... than/ 
more... than/not as adj. as 的 汉语 表达 式 。 如 : (not as adj. as 一 般 翻译 也 好 像 较 
少 使 用 “与 其 不 如 ”?) 


(12)“ 赠 人 以 车 ,不 如 赠 人 以 言 ” 

“A gift of a cart is not as good as a gift of words. ”; 

《13)“ 跟 车 铺 打印 子 , 还 不 如 给 我 一 分 利 呢 !” 

“Better to pay me ten per cent than pay the shop installment. ” 

(14)“ 我 以 为 这 一 点 的 可 能 性 很 大 ,他 马上 就 会 看 到 独角戏 不 如 搭 班 
子 好 。” 

“Not at all: I’m sure there’s every possibility that he’ll soon realize 
that it’s better to play a part in a big show than try to run a one-man show. ” 

(15) SHA RRA RR LS 

Rather than toss and turn on his warm pillow, Hung-chien would just as 
soon sit for a while longer on the deck. f 

(16) 他 叹 着 气 说 :“ 唉 ,与 其 因为 他 有 才能 而 被 夺 , 我 宁愿 他 是 一 个 一 无 
所 长 的 没 出 息 的 人 阿 。” 

He said with a sigh, “I would rather he be a mediocrity than a talent ed 
person and lose his life. ” 


《17) BOER SESE ABA ES A A Ht.” 
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Thus, they argue: “‘ Unintelligibility’ resulting from faithfulness is 
worse than faithlessness that makes translation ‘intelligible’. ” 


很 明显 ,“ 与 其 …… 不 如 ?这么 完整 又 有 点 机 械 的 结构 只 有 在 英汉 翻译 里 使 用 ， 
汉语 里 还 有 更 多 的 组 合 方式 可 供 选 择 ,这 也 是 英汉 翻译 时 译 者 应 参考 这 些 表 达 方 
式 ,以 避免 译文 流 于 单调 、 机 械 ( 见 图 21. 5) 。 


(ar eR 


一 a. ee E 
[FME oom CEO O ee se ee oe ee 


1 «four. Biome, 
47 Better go to bed supperiess than rise in debt. 


2 | anaes: x, 
But the Huns were much more wedded to the nomadic life than the early Greeks, who were rather migratory cattle farmers than true nomads. 
2 Mis, amena aiee . ihanne nx 


图 21. 5 “与 其 …… 不 如 ”的 相关 检索 结果 


以 上 检索 功能 的 最 大 优点 是 :在 语料库 足够 大 且 分 类 明晰 的 情况 下 , 译 者 可 以 
从 中 得 到 分 类 明确 .针对 性 较 强 的 参考 译文 ,这 些 十 分 有 用 的 功能 其 他 翻译 辅助 工 
具 都 不 具备 。 随 着 语 库 规模 的 扩大 和 检索 功能 的 完善 ,CEPC 的 翻译 辅助 功能 会 
更 加 突出 。 


21.4 单 语 语料库 辅助 翻译 


翻译 时 常常 遇 到 难以 把 握 的 词汇 运用 (词汇 选择 ,词汇 搭配 、 句 法 关系 ), 这 时 
可 以 参考 目的 语 原创 语料库 ,因为 原创 单 语 语料库 可 以 提供 更 丰富 的 语言 使 用 
信息 。 

前 文 说 过 , 爱 词霸 “百科 ”搜索 可 以 查 到 “山寨 机 ”的 英文 对 应 表达 emulational 
mobile phone, 而 灵 格 斯 的 “网 络 释义 ”提供 了 “山寨 ”的 对 应 词 copycatting。 这 两 
个 词 是 否 都 合适 呢 ? 我 们 在 COCA 中 没有 发 现 emulational。emulation 的 意思 是 
仿真 , 它 本 身 就 是 一 种 计算 机 技术 ,不 是 侵权 仿制 。 但 在 COCA 上 检索 到 copycat 
的 使 用 。 如 : 


C) Illegal sales over the phone and the Internet have been reported, and 
copycat products have already appeared. 

Audiences might now expect to see copycat movies. “Once one movie. 
hits, everybody usually tries to make a lot of them,” says Adam Schroeder. 
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这 两 个 例子 里 的 copycat products 和 copycat movies 可 以 分 别 译 成 “山寨 产品 ?和 
“山寨 版 电影 "。 这 样 说 来 ,山寨 机 ? 译 为 “copycat mobile phone” 该 不 会 有 问题 。 

再 如 ,垃圾 邮件 > 有 junk mail 和 spam 两 个 对 应 项 。COCA 的 检索 结果 显示 ， 
spam 使 用 的 频率 远 远 高 于 junk mail。 而 且 ,Yahoo 英文 网 站 的 邮件 系统 里 就 是 用 
spam 指 垃圾 邮件 。 这 样 ,“ 垃 圾 邮件 ”的 典型 对 应 词 应 该 是 spam, 

面 对 “ 群 体 事件 ” 令 人 有 眼花 综 乱 的 对 应 项 (mass incident/event/disturbance; 
group affair/event/accident;colony event, mass emergency) 。 我 们 进入 COCA 语 
料 库 尝试 检索 ,发 现 ,group event 常用 ,但 意思 是 集体 项 目 ;, 只 有 “mass incident” 被 
认可 ,尽管 它 还 不 是 正式 的 用 语 ;其 他 均 无 参考 价值 。 百 度 和 Google 搜索 常见 的 
是 group event 和 colony event, 但 大 都 与 CNKI 知识 搜索 有 关 , 是 汉语 学 术 文献 的 
译 法 ,同样 不 可 取 。 以 下 是 COCA 中 检索 到 的 用 法 : 


(1) popular discontent is bubbling in China. Last year, there were 
58000 “mass incidents” across China, according to government statistics cited 
in the Chinese magazine Outlook. 

(2) Chinese government’s own figures, last year there were more than 
80000 “mass incidents” throughout the country. It is commonly believed that 
a great number of these 

(3) erupt on a regular basis. The Ministry of Public Security reported 
17 900 “mass incidents” in the first nine months of 2006, They are almost 
always snuffed out 


Bh, PRERE LE TORT CALA) ALB BP BEL — PHY HTH, BA stampede, 
在 COCA 中 我 们 还 发 现 了 更 多 的 对 应 项 。 如: 


Mayor Daley’s top lawyer told a judge today that one of the owners of 
the Near South Side nightclub where 21 people died in a stampede should be 
thrown in 


这 说 明 ,踩踏 事件 最 合适 的 译文 是 stampede, 而 不 是 其 他 词 。 机 器 翻译 的 
不 可 靠 性 可 见 一 斑 。( 以 上 没有 指出 COCA 有 其 他 更 多 的 对 应 项 ,只 是 进一步 验 
证 了 确实 灵 格 斯 ( 句 酷 ) 和 爱 词霸 中 存在 “stampede” 的 使 用 。 也 不 能 以 这 一 点 证 明 
机 器 翻译 的 不 可 靠 性 。 

在 实际 翻译 时 , 汉 英 对 应 语料库 中 的 原创 文本 库 本 身 就 可 以 用 作 单 语 库 , 常 用 
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词 的 组 合 和 搭配 可 以 在 这 类 库 中 检索 。 如 果 对 应 库 解 决 不 了 ,就 需要 通过 检索 更 
大 的 单 语 库 来 确定 用 法 。 由 此 看 来 , 单 语 和 双语 语料库 在 翻译 实务 中 的 用 途 是 其 
他 各 类 翻译 辅助 软件 无 法 蔡 代 的 。 


21.5 小 结 


机 器 翻译 在 翻译 辅助 方面 的 功用 有 限 ; 基 于 翻译 实例 的 翻译 记忆 对 翻译 的 畏 
助 作用 高 于 机 器 翻译 ,但 由 于 检索 功能 过 于 单调 ,辅助 作用 还 是 有 限 。 相 上 比 而 言 ， 
双向 双语 对 应 语料库 对 翻译 辅助 作用 更 加 突出 , 它 可 能 提供 的 丰富 的 翻译 对 应 信 
息 其 他 工具 无 法 提供 。 因 此 ,在 双语 对 应 语料库 这 个 操作 平台 上 , 译 者 可 以 充分 利 
用 它 的 各 种 潜能 ,高 效 高 质地 完成 翻译 任务 。 我 们 相信 , 随 着 制作 和 检索 技术 日 趋 
完善 , 汉 英 对 应 语料库 将 成 为 功能 强大 的 机 助 翻译 工具 。 


附 : 本 章 涉及 的 主要 在 线 检索 平台 网 址 


Babel Fish; http: //babelfish. yahoo. com/ 

Babylon Pro; http: //translation. babylon. com/ 

Free Online Language Translator; http: // www. worldlingo. com/en/ 
products_services/worldlingo_translator. html 

Google 语言 工具 :http: //translate. google. cn/translate_t?hl=zh-CN # 

Yahoo 翻译 :http: // fanyi. yahoo, com. cn/translate_txt 

北 外 中 英 双 语 在 线 (CEO) : http: //202, 204, 128. 82/ceo/index1. html 

华 建 翻译 ;http: // www. hjtrans. com/ 

金山 爱 词 霸 :http; // www. iciba. com/ 

句 酷 :http: // www. jukuu. com/ 

AH MA: http: //fanyi. youdao, com/ 
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专门 对 应 语料库 的 研制 


在 评介 国内 外 现 有 单 语 或 双语 旅游 专门 语料库 的 基础 上 ,本 章 着 重 论述 一 种 
新 型 中 英 双语 旅游 语料库 的 研制 ,特别 是 其 设计 理念 和 操作 程序 ,包括 语 料 文本 的 
数字 化 、 语 料 的 标注 、 语 料 的 对 齐 和 语 料 的 篇 头 标注 等 。 本 章 最 后 论述 了 旅游 语 料 
库 在 推动 旅游 翻译 研究 与 教学 的 前 景 。 


22.1 引言 


过 去 20 年 来 ,基于 语料库 的 翻译 研究 从 无 到 有 ,发 展 迅速 。 目 前 ,翻译 研究 中 
常用 的 语料库 主要 有 译文 语料库 (translational corpus)、 类 比 语料库 (comparable 
corpora) 和 对 应 语料库 (parallel corpus) 三 种 。 译 文 语料库 收录 译文 ,其 研究 目的 
在 于 揭示 翻译 语言 本 身 独 有 特征 (如 Mona Baker 建立 的 “翻译 英语 语料库 ”, 即 
TEC)。 类 比 语料库 主要 是 同一 种 语言 的 原生 文本 和 翻译 文本 ( 译 自 某 种 外 语 ) 构 
建 的 语料库 ,它们 之 间 无 翻译 对 应 关系 ,但 在 时 代 、 体 裁 ,主题 等 方面 具有 可 比 性 ， 
可 用 来 研究 翻译 语言 的 特点 。 这 类 研究 可 参看 Laviosa(2002) 。 

相对 于 以 上 两 种 语料库 ,翻译 研究 中 更 为 常用 的 是 对 应 语料库 , 它 收录 原文 与 
译文 双语 对 照 的 文本 ,通常 会 按 事 先 设 定 的 标准 (如 以 名 或 段 为 单位 的 方式 ) ,对 语 
料 进行 某 一 语言 单位 上 的 对 齐 (如 句 或 段 ) 以 方便 检索 。 对 应 语料库 常用 于 考察 原 
文中 的 某 些 语言 现象 如 何在 译文 中 得 到 反映 ,最 终 目 的 在 于 揭示 翻译 活动 中 隐 人 性 
的 规律 。 目 前 对 应 语料库 在 不 同 的 国家 和 地 区 都 有 广泛 的 利用 , 比较 知名 的 有 挪 
威 的 “英语 一 挪威 语 对 应 语料库 ”英国 的 “德语 一 英语 文学 文本 对 应 语料库 ?以 及 
我 国 由 北京 外 国语 大 学 中 国外 语 教 育 研究 中 心 研制 的 “ 汉 英 对 应 语料库 ”等 。 

纵 观 目前 为 翻译 研究 而 建 的 上 述 三 种 语料库 ,多 数 是 以 文学 文本 为 主 ,或 以 收 
纳 百科 文本 (包括 各 种 文学 与 非 文学 作品 ) 为 特色 的 通用 型 .综合 型 语料库 ,以 及 法 
律 .财经 .农林 、 医 学 等 专科 型 语料库 ,是 比较 大 型 的 双语 语料库 ,而 结合 地 域 特点 
的 或 针对 某 一 文 类 而 专门 研制 的 双语 专门 语料库 较为 少见 。 专 门 语料库 指 的 是 
“关于 特定 主题 文本 的 集合 ”, 且 这 些 文本 “ 均 由 行内 专家 为 不 同 的 读者 群 所 写 ”, 这 
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些 读者 群 可 能 是 同行 的 专家 ,或 是 缺乏 相关 专业 知识 的 大 众 , 亦 可 能 是 学 生 等 
(Kubler 2003:29) 。 双 语 的 专门 语料库 则 收集 包括 原文 与 译文 的 专题 文本 。 

迄今 为 止 , 专 门 为 翻译 研究 而 研制 的 应 用 型 双语 专门 语料库 并 不 多 , 且 通 常规 
模 较 小 ,从 几 万 词 \, 几 十 万 词 到 百 万 词 不 等 。 小 型 的 双语 专门 语料库 由 于 其 规模 
小 \ 建 造 方便 和 针对 性 强 等 特点 , 常 在 术语 翻译 研究 或 培训 特定 领域 (如 专门 法 律 
翻译 ,特定 财经 翻译 等 ) 的 译员 中 作为 辅助 工具 ,如 Kiibler(2003) 为 培训 软件 指南 
译员 而 建立 的 小 型 英法 计算 机 语料库 。 

双语 专门 语料库 无 论 对 翻译 研究 还 是 译员 培训 都 有 其 潜在 的 价值 。 早 在 
1991 年 Johansson 就 提出 ,双语 专门 语料库 可 以 帮助 我 们 解决 不 少 特定 的 问题 , 因 
而 在 各 种 语料库 中 ,尤其 值得 提倡 。 正 如 Olohan 所 言 , 专 门 语料库 不 仅 能 帮 我 们 
研究 与 普通 语料库 中 同时 存在 的 一 些 普遍 的 语言 现象 和 规律 ,还 能 考察 那些 仅 属 
于 这 个 类 型 文本 的 一 些 与 众 不 同 的 特点 (2004:20) 。 从 语言 运用 角度 而 言 ,双语 专 
门 语料库 (尤其 是 非 文学 专门 语料库 ) 能 帮助 译 者 理解 和 掌握 同一 领域 中 不 同 语言 
的 常用 术语 ,惯用 表达 式 \ 文 章 语气 及 典型 的 语 篇 结构 ,避免 在 专业 翻译 中 经 常 出 
现 的 语言 “不 自然 或 “形似 而 神 不 似 ” 的 现象 。 但 时 至 今日 ,无 论 国内 国外 , 较 具 规 
模 的 双语 专门 语料库 还 不 多 见 ,如 旅游 方面 就 仅 有 一 些小 规模 的 语料库 。 


22.2 现 有 旅游 专门 语料库 


迄今 ,国内 外 专门 收录 旅游 文本 的 单 语 或 双语 语料库 均 不 多 见 。 纵 览 相 关 文 
献 , 我 们 发 现 国外 的 旅游 专门 语料库 主要 有 以 下 三 个 ,分 别 为 芬兰 .英国 和 日 本 学 
者 研制 。 

第 一 ,芬兰 萨 伟 林 纳 翻 译 研究 学 院 (Savonlinna School of Translation Studies) 
的 英语 教师 Michael Wilkinson 研制 的 合共 67 万 词 英语 旅游 文本 语料库 。 该 语 料 
库 主要 供 芬兰 学 生 将 芬兰 旅游 文本 译 至 英语 时 参考 ,检验 他 们 的 译文 用 词 是 否 地 
道 。 同 时 ,学 生 可 以 利用 该 语料库 来 “确认 、 证 实 或 握 弃 主观 的 决策 ,或 是 获得 搭配 
方面 的 用 法 ”(2005:1) 。 

第 二 ,英国 埃 塞 克 斯 大 学 (University of Essex) 的 研究 生 Carlota Alcantar 
(2007) 研 制 的 英语 旅游 文本 语料库 。 该 语料库 总 词 数 为 37 795, 收集 的 旅游 文本 
分 别 来 自 1) 政 府 旅 游 部 门 的 介绍 ;2) 酒 店 .餐馆 和 旅行 社 的 宣传 资料 ;3) 语 言 培训 
学 校 相 关 的 资料 。 语 料 库 研制 目的 在 于 总 结 出 英语 旅游 文本 写作 中 最 常用 的 421 
个 词汇 和 短语 ,以 帮助 墨西哥 纳 亚 里 特 州立 大 学 旅游 学 院 的 教师 有 效 地 教授 旅游 
常用 词汇 。 

第 三 ,日 本 大 学 (Nihon University) 的 Kiyomi Chujo 等 (2006) 研 制 的 “京都 旅 
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游 语 料 库 ?(Kyoto Tourism Corpus)。 此 单 语 语料库 收集 的 均 为 日 本 京都 市 用 英 
文 写 就 的 关于 京都 旅游 介绍 的 文本 共 885 篇 ,平均 每 篇 47 个 词 ,收录 了 2786 个 不 
同类 符 (types) 和 42025 形 符 (tokens) 。 库 中 所 有 的 词语 都 用 CLAW7 标注 软件 消 
除 届 折 形 式 ,还 按 词性 作 了 标注 。 语 料 库 旨 在 归纳 出 适合 于 日 本 旅游 市 场 (尤其 是 
京都 地 区 ) 的 几 百 个 最 常用 的 旅游 英语 词汇 ,以 供 在 日 本 大 学 学 习 旅 游 英语 课程 的 
不 同 程度 的 学 习 者 使 用 。 

我 国 国内 研制 旅游 专门 语料库 更 为 鲜 见 。 汉 志 伟 (2001) 提 及 ,中 国 科学 院 自 
动 化 所 建立 了 一 个 旅游 咨询 口语 对 话语 料 库 和 一 个 旅馆 预定 口语 对 话语 料 库 , 但 
关于 这 个 口语 语料库 的 情况 却 一 直 不 为 人 知 。 除 此 之 外 ,国内 尚 不 见 有 其 他 专门 
研发 的 旅游 语料库 (无 论 是 单 语 还 是 双语 ) 。 

综 上 所 述 ,国内 外 旅游 专门 语料库 的 研制 还 很 不 够 , 现 有 的 几 个 有 如 下 一 些 特 
点 :一 是 规模 小 ,除了 Wilkinson 的 语料库 有 67 万 词 外 ,其 他 两 个 语料库 的 规模 均 
不 超过 五 万 词 ,并 且 形 式 单一 , 均 为 单 语 (英语 ) 语 料 库 。 二 是 语料库 的 设计 比较 简 
单 ,选择 语 料 的 方法 含糊 不 清 , 也 没有 说 明 其 选择 语 料 的 标准 ,容易 让 人 质疑 其 语 
料 的 代表 性 。 三 是 相对 于 其 他 综合 语料库 而 言 ,这 些 语料库 对 语 料 的 处 理 都 很 粗 
糙 , 除 日 本 大 学 的 语料库 外 ,其 他 的 均 未 对 语 料 做 后 期 整理 (包括 对 齐 、 标 注 、 加 篇 
头等 )。 四 是 这 些 专门 语料库 的 用 途 都 较 单 一 ,都 是 为 旅游 英语 (尤其 是 词汇 ) 的 教 
学 而 研制 。 至 于 旅游 文本 在 结构 ,修辞 上 的 特点 等 深层 次 的 问题 完全 没有 探究 ,也 
没有 考虑 到 旅游 翻译 教学 与 研究 上 的 问题 。 本 章 介绍 的 新 型 双语 旅游 语料库 希望 
能 克服 以 上 弱点 , 既 可 直接 用 于 指导 现实 中 的 旅游 翻译 (实践 意义 ), 亦 可 用 于 促进 
旅游 翻译 教学 和 研究 (理论 意义 ) 。 


22.3 ”新 型 双语 旅游 语料库 的 设计 思路 和 特点 


本 章 以 下 着 重 描述 我 们 新 近 研制 的 新 型 双语 旅游 语料库 ( 获 香港 理工 大 学 资 
助 )。 这 是 国内 第 一 个 较 大 容量 的 英汉 / 汉 英 旅游 语料库 。 我 们 主要 介绍 这 个 语 料 
库 的 研制 思路 和 方法 、 语 料 库 的 构成 和 特点 ,并 讨论 专门 语料库 的 发 展 前 景 。 

如 Kennedy 所 言 ,无 论 何 种 语料库 ,其 整体 的 设计 和 语 料 的 汇集 对 于 “基于 该 
语料库 的 研究 的 信 度 和 效 度 都 具有 十 分 重大 的 作用 ”(1998:60)。 它 还 直接 影响 到 
语料库 所 设计 的 研究 目的 和 教学 作用 能 不 能 有 效 实现 。 就 本 旅游 语料库 而 言 , 设 
计 目 的 有 三 : 

一 是 研究 用 途 。 包 括 旅游 语言 本 身 特 点 的 研究 及 旅游 翻译 特点 的 研究 。 前 者 
研究 旅游 语言 在 语 篇 ,修辞 、 词 汇 等 语言 层面 上 与 普通 语言 不 同 的 特点 ;后 者 则 研 
究 在 翻译 过 程 中 旅游 翻译 与 普通 翻译 的 不 同 特点 。 研 究 问题 包括 :旅游 翻译 在 语 
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言 特点 上 是 否 存在 与 普通 翻译 一 样 的 共性 ? 抑或 有 自己 另外 的 特点 ? 这 些 特点 是 
与 特定 时 期 的 翻译 规范 有 关 还 是 超越 时 间 、 时 空 限制 ? 

二 是 翻译 教学 用 途 。 具 体 来 说 ,本 语料库 将 为 教授 中 英 双语 旅游 翻译 的 教师 
提供 真实 的 教学 材料 ,并 为 设计 数据 驱动 教学 (data-driven learning, 简 称 DDL) 提 
供 真 实 和 多 样 化 的 资源 。DDL 这 里 指 的 是 “在 课堂 上 利用 电子 计算 机 生成 的 索引 
(concordances) 来 帮助 学 生发 掘 目标 语 模 式 (pattern) 中 的 规律 ,并 根据 索引 结果 
来 研发 种 种 学 习 活动 及 设计 学 习 练 习 ”(Johns and King 1991; 让 ) 。 就 本 旅游 语 料 
库 而 言 , 就 是 根据 语料库 比较 和 检索 的 结果 ,开发 出 各 种 DDL 的 教学 手段 来 辅助 
旅游 翻译 的 教学 。 而 学 生 亦 能 从 语料库 中 揣摩 职业 旅游 翻译 译员 所 用 的 翻译 策 
略 , 从 比较 ,思考 中 学 习 他 们 老 到 的 方法 与 技巧 。 开 发 DDL 教学 手段 往往 需要 更 
大 规模 的 语料库 ,本 库 建 成 后 会 持续 扩容 ,以 满足 DDL 需求 。 

三 是 实用 性 。 即 能 够 为 国内 外 从 事 涉外 旅游 的 英汉 语 从 业者 提供 方便 的 旅游 
翻译 参考 或 用 作 自学 材料 ,提高 他 们 的 业务 水 平 。 

为 了 实现 上 述 目 标 ,本 语料库 在 设计 时 必须 严谨 ,确保 语料库 的 效 度 和 信 度 。 
语料库 设计 时 要 考虑 的 因素 很 多 ,大 体 可 分 为 整体 设计 和 具体 操作 两 个 层面 。 下 
面 分 述 这 两 个 层面 。 


22.3.1 整体 层面 的 考虑 


从 性 质 来 看 ,本 语料库 属于 专用 (specialized) 、 同 质 的 (homogeneous) 语 料 库 
〈 黄 昌 宁 ,2002), 只 收集 与 旅游 景点 介绍 相关 的 中 ,英文 原生 性 的 (spontaneously 
sourced texts) (Mason 2001:68) 旅 游 文 本 及 相关 的 中 - 英 互 译文 本 (在 时 机 成 熟 后 
亦 会 扩展 至 收集 与 旅游 相关 的 行业 ,如 酒店 .交通 等 介绍 的 文本 ) 。 这 就 局 限 了 本 
语料库 的 文本 采样 不 能 像 异 质 语料库 般 采 用 随 遇 性 的 文本 采样 原则 ,而 只 能 是 采 
取 目 的 性 取样 标准 (purposeful sampling)。 为 了 确保 采集 到 的 文本 在 内 容 上 与 语 
料 库 研制 目的 相关 ,在 语言 上 符合 标准 ,本 语 料 建设 中 除了 会 实行 多 个 专家 把 关 制 
之 外 ,还 会 推出 同 售 报 告 (peer debriefing) 及 研究 成 员 的 检视 (member check) 等 上 
述 方法 来 核实 文本 的 适合 性 和 代表 性 。 同 时 ,对 于 某 些 介绍 比较 多 的 旅游 景点 文 
本 材料 ,在 选取 这 些 材料 入 库 时 我 们 亦 会 附加 以 三 角 验 证 法 (triangulation) ,多 渠 
道 , 多 方式 地 反复 核对 人 库 文本 (Li 2004)。 以 上 这 些 确保 文本 数据 有 效 性 
《validity) 的 做 法 均 是 传统 的 双语 旅游 语料库 研制 中 所 鲜 见 的 。 

下 面 我 们 就 本 语料库 在 构成 大小、 语 料 的 代表 性 及 语 料 的 选择 等 具体 做 法 作 
进一步 介绍 。 

22.3.1.1 语料库 的 构成 和 大 小 

从 整体 上 看 ,本 语料库 由 一 个 双语 旅游 翻译 对 应 语料库 (parallel corpus, 简 称 
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PC) 与 一 个 双语 旅游 翻译 类 比 语料库 (comparable corpora, 简称 CC) 组 成 。 在 研究 
的 第 一 阶段 ,这 两 个 语料库 暂 定 为 各 100 万 字 / 词 (为 统计 方便 ,汉语 部 分 按 字数 计 
算 ,英文 部 分 按 词 数 计算 ) ,目前 各 个 语料库 已 经 完成 三 分 之 二 。 按 照 我 们 的 设计 ， 
PC 与 CC 均 为 动态 语料库 (dynamic corpora) , 即 在 将 来 会 按 每 两 年 一 次 的 频率 ， 
把 符合 条 件 的 文本 补充 至 各 库 之 中 ,并 不 断 提高 加 工 的 深度 。 与 那些 只 是 选择 特 
定时 间 范 围 内 部 分 语言 现象 的 静态 语料库 相 比 ,本 语料库 的 动态 设计 能 够 反映 旅 
游 用 语 及 旅游 翻译 的 时 代 变 迁 和 语言 风格 的 变化 。 动 态 设计 的 思路 会 让 本 旅游 语 
料 库 的 规模 逐渐 扩大 ,同时 也 为 研究 旅游 翻译 和 旅游 语言 提供 了 纵向 研究 的 可 能 。 
在 现 阶 段 ,PC 与 CC 合并 起 来 有 200 万 字 词 。 语 料 库 是 否 适用 的 主要 因素 并 非 全 
在 于 其 规模 的 大 或 小 ,而 主要 在 于 “适用 于 语料库 的 文本 是 否 容易 获得 ,或 是 取决 
于 其 他 因素 ,诸如 文本 是 否 需要 手动 标注 等 "(Hunston 2002:26) ,以 及 语料库 能 不 
能 实现 研制 目的 (如 旅游 翻译 的 教学 ) 和 解决 预定 的 一 些 研 究 问题 (如 旅游 语言 的 
特点 )。 对 于 本 研究 而 言 ,各 100 万 字 词 的 PC 和 CC, 在 语 料 收集 和 分 析 上 较 易 做 
到 , 且 在 现 阶段 为 达到 这 个 目标 ,在 财力 和 在 人 力 的 资源 上 尚 可 操控 。 

PC 是 一 个 双向 的 汉 英 /英汉 旅游 翻译 语料库 , 先 收录 香港 地 区 的 英 译 汉 和 汉 
译 英 的 旅游 翻译 文本 ,并 逐步 将 收集 的 范围 扩大 到 大 陆 、 台 湾 以 及 全 球 华 人 地 区 的 
旅游 文本 。 这 些 文本 包括 以 网 页 形式 的 电子 文本 和 以 书面 形式 的 文字 文本 (包括 
书籍 .宣传 册 ,旅游 区 内 张贴 的 介绍 等 ) 。 

CC 主要 收录 香港 地 区 为 主 的 两 岸 三 地 非 翻译 (non-translation) 的 汉语 和 英文 
旅游 原生 性 文本 。 英 文 旅游 文本 将 涵盖 英 、 美 . 澳 等 主要 以 英语 为 母语 的 国家 ( 国 
别 在 语 料 中 加 以 标识 )。 与 PC 一 样 ,CC 收录 的 文本 范围 同样 包括 来 自 电子 、 书 面 
以 及 其 他 媒介 形式 的 文本 。 在 构建 CC 时 ,我 们 注重 让 汉语 文本 库 与 英文 文本 库 
在 以 下 几 个 主要 参数 上 具有 一 致 性 ,以 确保 收录 在 CC 中 的 中 英文 文本 具有 最 大 
的 可 比 性 ,如 文本 均 全 文 收录 ,长 度 大 致 相近 、 文 本 创作 的 时 间 跨 度 均 为 过 去 十 年 、 
文本 的 作者 尽 可 能 多 样 等 (Laviosa 1997)。 这 些 参数 的 一 致 性 至 少 能 确保 CC 在 
设计 上 避免 由 于 中 英文 本 语 料 的 不 均衡 而 造成 研究 中 出 现 错误 的 或 有 偏差 的 
结论 。 

PC 与 CC 相 结 合 的 设计 考量 在 于 让 这 两 种 语料库 的 特点 互补 。Johansson 
《1998:6) 认 为 ,PC 研究 中 出 现 的 一 些 不 容易 解答 的 问题 , 需 以 CC 为 比较 参照 系 
才能 得 到 让 人 信服 的 答案 。 这 些 问题 包括 :译文 在 多 大 程度 上 体现 普通 语言 的 运 
用 ? 译文 在 多 大 程度 上 受到 原文 的 影响 ? 以 及 译文 具有 什么 样 的 总 体 特 征 ? 等 
等 。 正 因为 PC 与 CC 结合 能 在 语料库 翻译 研究 中 发 挥 更 大 的 增 效 作 用 ,近来 有 不 
少 翻译 学 者 都 提倡 把 PC 中 的 一 些 发 现 运用 在 CC 的 背景 框架 中 解释 ,充分 发 挥 语 
料 库 翻 译 研究 的 定性 与 定量 研究 相 结合 的 优势 (Kenny 2006)。 除 此 之 外 ,本 语 料 
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库 里 具有 双向 性 的 PC 与 CC 结合 还 能 提供 更 广阔 ,更 丰富 的 语言 对 比 潜能 。 如 图 
22. 1 所 示 ,C 表示 本 旅游 语料库 的 组 成 部 分 。 


图 22.1 旅游 语料库 结构 图 中 


从 图 22. 1 可 见 , 若 以 库 为 单位 ,本 语料库 内 可 以 作 子 库 之 间 的 比较 ,至 少 有 以 
下 几 种 可 能 性 :1) 可 以 是 PC 研究 中 常见 的 原文 与 译文 的 比较 (C1:C4;C2:C3); 
2) 可 以 作 同 一 种 语言 之 间 译文 与 非 译文 的 比较 (Cl:C3;C5:C3;C2:C4;C6:C4); 
3) 亦 可 以 是 不 同 语言 之 间 ( 这 里 即 汉语 与 英文 ) 非 译文 之 间 的 比较 (C5:C6)。 同 
时 ,C5 和 C6 还 能 起 到 参考 语料库 的 作用 ,为 C1:C4 和 C2:C3 时 提供 尽 可 能 多 的 
参照 系 。 本 旅游 语料库 的 这 种 设计 方式 为 最 大 限度 地 有 效 利用 语料库 创造 了 条 件 。 

PC 与 CC 选取 的 旅游 文本 主要 包括 :1) 自 然 景观 .人 文 景观 的 介绍 ;2) 观 光 小 
册子 ;3) 酒 店 \ 旅 馆 、 餐 饮 业 及 娱乐 场所 和 设施 的 介绍 ;4) 博 物 馆 (包括 展品 ) 的 说 明 
和 介绍 。 将 来 还 可 考虑 收集 与 旅游 业 相 关 的 其 他 行业 的 文本 ,如 与 交通 .导游 、 票 
务 、 旅 行 社 业务 (包括 旅游 行程 设计 ) 、 货 币 兑换 ,投诉 处 理 .旅游 安全 、 旅 游 管理 部 
门 的 宣传 和 公示 语 等 相关 的 文本 。 

22.3.1.2 语 料 的 选取 和 代表 性 问题 

香港 旅游 业 兴旺 ,市 场 上 充斥 着 大 量 与 旅游 相关 的 宣传 页 和 小 册子 。 数 量 多 ， 
质量 难免 良 其 不 齐 ,这 就 更 凸现 了 语 料 选取 过 程 的 重要 性 。Kennedy 特别 指出 语 
料 的 代表 性 问题 一 一 即 所 选 语 料 能 否 代表 这 个 领域 中 的 大 多 数 文本 一 一 是 语料库 
建设 必须 考虑 的 一 个 重要 问题 。 他 认为 ,选择 语 料 时 必须 注意 的 问题 包括 : 语 料 的 
文学 价值 、 社 会 上 的 影响 、 所 面向 的 读者 群体 文本 地 区 性 和 时 间 因 素 等 等 (1998: 
62-66)。 由 于 Kennedy 针对 的 是 单 语 普通 语料库 (尤其 是 文学 语料库 ) 的 建设 ,他 

“ 所 提 及 的 上 述 要 素 并 非 全 都 适用 于 本 语料库 。 但 就 本 语料库 而 言 ,在 面 对 大 量 有 

关 旅 游 的 文本 时 ,“ 研 究 者 需要 考虑 一 系列 的 问题 ,确定 一 系列 的 标准 ,帮助 作出 选 


© 本 图 部 分 改编 自 Johansson 和 Hofland(1994:26)。 
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择 和 排除 某 些 文本 的 决定 ”(Olohan 2004:46). 

借用 Maia(2003:45) 的 做 法 ,本 旅游 语料库 订 出 以 下 几 条 标准 :1) 据 社会 语 域 
标准 (如 分 为 景点 介绍 、 观 光 介绍 、 旅 游 配 套 设施 介绍 等 若干 类 ) ,将 分 层 抽样 .均衡 
抽样 和 比例 抽样 结合 使 用 ,使 入 库 语 料 具有 一 定 代表 性 ;2) 所 有 文本 ,车 含 任何 语 
法 、 用 词 或 印刷 上 的 错误 , 均 不 收录 ,或 略 加 更 正 后 收录 ;3) 就 翻译 文本 而 言 ,任何 
太 过 贴近 原文 句法 结构 以 致 僵硬 的 译文 不 予 收 录 ;4) 在 最 后 阶段 ,部 分 文本 请 精通 
中 英 双 语 的 专家 和 翻译 教师 审阅 其 语言 和 用 法 上 的 可 接受 性 。 由 于 本 旅游 语料库 
除了 用 于 语言 研究 外 ,还 会 用 于 教学 ,上 述 严 谨 选 材 除了 尽量 使 语 料 具有 代表 性 
外 ,还 要 确保 文本 有 一 定 的 质量 ,这 样 才 不 会 对 旅游 翻译 教学 造成 反 效果 。 

可 能 有 人 认为 , 语 料 若 不 是 全 部 用 随机 方式 而 任意 抽取 ,反而 不 利于 呈现 旅游 
文本 的 “最 自然 的 状态 ”, 因 而 语料库 也 并 非 所 有 香港 旅游 文本 的 最 真实 反映 ,而 是 
带 有 很 大 的 主观 色彩 。 对 此 ,我 们 认为 :1) 对 语 料 进行 适当 选择 是 当今 绝 大 部 分 语 
料 库 的 通用 做 法 , 亦 是 一 种 发 展 趋势 (如 BNC 就 对 不 少 语 料 进行 了 剪裁 ) ,只 不 过 
很 多 语料库 建设 者 未 将 选材 标准 明确 列 出 而 已 。 未 经 挑选 的 大 量 原 始 语 料 的 集合 
只 会 让 语料库 内 容 参 差 不 齐 ,水 平 不 一 。 由 这 些 材料 集合 而 成 的 语料库 虽然 最 少 
受到 研究 者 的 “干扰 ”( 即 研究 者 主观 性 的 影响 ) ,但 它 却 不 利于 开展 研究 或 教学 ,而 
后 者 恰恰 才 是 语料库 建设 的 目的 ;2) 所 有 语料库 都 不 可 能 做 到 完全 客观 ,不 受 研 究 
者 主观 性 的 影响 。 正 如 Crisafulli 所 言 ,“ 语 料 库 从 开始 设计 如 就 是 一 种 (设计 者 ) 
诠释 的 表现 "(2002:32) 。 不 少 学 者 亦 指出 ,语料库 的 设计 以 及 语 料 的 收集 (包括 要 
容纳 哪些 主要 信息 和 次 要 信息 等 ) ,都 要 根据 研制 语料库 之 前 所 设 定 的 研究 目的 和 
研究 问题 而 定 (Olohan 2004:42) ,只 要 语料库 的 选材 能 够 达到 预定 的 目的 ,语料库 
的 设计 和 语 料 的 组 成 能 与 研究 目的 相符 ,能 让 学 者 进行 相应 的 研究 ,这 就 是 一 个 好 
的 语 料 选取 过 程 。 


22.3.2 具体 操作 层面 的 考虑 


语料库 具体 操作 层面 的 考虑 因素 包括 语 料 文本 的 数字 化 、 语 料 的 标注 . 语 料 的 
对 齐 、. 语 料 的 篇 头 标注 等 实际 问题 。 

第 一 , 语 料 文本 的 数字 化 。 目 前 ,语料库 所 收录 的 文本 绝 大 部 分 来 源 于 以 下 三 
种 途径 :网 上 的 电子 文本 、 以 纸 质 形式 出 现 的 印刷 品 、 书 籍 或 宣传 页 和 拍摄 下 来 的 
以 建筑 物 形式 树立 的 有 关 旅 游 景 区 的 介绍 。 所 有 的 这 些 材料 都 需 转 为 txt 文档 
备用 。 

不 少 印刷 品 都 带 有 插图 .照片 ,标志 等 Nord 称 之 为 “ 非 言语 因素 ”(non-verbal 
elements)《2005:118) 以 及 用 不 同 字体 大 小 、 形 式 、 下 划 线 等 来 模仿 语调 ,语气 和 停 
顿 功能 的 “ 超 音 段 特征 ”(suprasegmental features) ,它们 都 构成 了 旅游 文宣 中 不 可 
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缺少 的 一 部 分 。 但 在 转换 成 语料库 电子 文本 后 ,无 论 是 “ 非 言 语 因 素 ” 和 " 超 音 段 特 
征 ” 都 得 去 除 ,以 方便 标注 和 以 后 的 检索 ,因此 ,我 们 对 于 具有 这 些 特征 的 文本 就 在 
其 电子 文本 的 “篇 头 ”" 上 注 明 ,方便 研究 者 和 学 习 者 如 有 需要 时 去 打开 相应 的 扫描 
文档 来 查找 ,同时 亦 会 在 文本 中 出 现 这 些 “ 超 音 段 特征 ”的 地 方 以 赋 码 二 SUS 志 > 做 
人 工 标注 ,让 使 用 者 能 够 通过 计算 机 快速 查找 。 以 相片 出 现 的 旅游 介绍 则 需要 手 
工 输入 ,之 后 亦 存 为 txt 文档 备用 。 

第 二 , 语 料 的 标注 。 在 本 章 , 标 注 指 对 语 料 成 分 (通常 是 词性 词类) 的 划分 ,以 
方便 进一步 检索 和 研究 , 这 种 标注 方式 称 之 为 POS 标注 法 (part-of-speech 
tagging)。 对 于 英文 语 料 , 一 般 的 POS 标注 法 就 是 参考 BNC 对 语 料 词性 和 词类 的 
划分 和 缩写 方法 (如 NNI 表示 单数 名 词 .NN2 表示 复数 名 词 .NP0 表示 专 有 名 词 
等 ,参看 BNC 网 站 ), 先 用 软件 (如 CLAWS 标注 系统 ) 进 行 机 器 标注 。 由 于 机 器 标 
注 都 不 能 达到 百 分 百 的 标注 准确 率 ( 最 好 的 CLAWS 标注 系统 也 只 能 达到 96% 左 
右 , 见 Kennedy 1998:218), 因 此 机 器 标注 完成 后 还 要 进行 人 工 修正 。 汉 语 亦 有 类 
似 标注 词性 和 词类 的 系统 ,但 其 准确 性 不 如 CLAWS, 且 汉语 词性 的 区 分 不 如 英文 
的 清晰 ,因而 标注 汉语 语 料 人 工 后 期 修正 的 时 间 要 花费 更 多 。 

本 语料库 除了 按照 传统 的 POS 标注 外 ,还 根据 旅游 文本 中 的 一 个 突出 的 修辞 
特点 ,在 语 料 上 采用 相应 的 修辞 手段 标注 。 研 究 员 在 研读 文本 时 ,分 别 会 根据 文本 
在 语音 ,词汇 和 语法 上 的 修辞 特点 ,在 语 料 中 标 出 所 使 用 的 修辞 或 比喻 手法 。 这 种 
标注 方法 由 于 没有 现成 的 软件 可 以 做 到 ,一 切 只 能 人 工 进行 ,所 以 费时 甚 巨 。 但 一 
且 标 注 完成 , 它 将 为 我 们 揭示 英汉 旅游 文本 在 修辞 用 法 上 的 不 同 以 至 于 文本 背后 
两 种 民族 的 审美 观念 的 不 同 提供 有 力 的 佐证 ,这 对 比较 修辞 学 、 比 较 美学 研究 等 都 
大 有 神 益 。 

针对 旅游 文本 及 旅游 翻译 的 特点 ,本 语料库 亦 会 使 用 一 些 CLAWS? 的 码 集中 
没有 的 自主 创设 码 来 对 语 料 进 行 标注 。 这 些 自主 创设 码 主要 有 两 类 :一 类 是 用 
于 标注 上 述 提 及 的 “ 超 音 段 特征 ”, 以 创设 码 二 SUS 二 表示; 另 一 类 是 各 种 类 型 的 
修辞 手段 (rhetorical devices) ,在 创设 码 上 全 以 <<RHE 之 开头 ,后 面 会 加 以 一 个 或 
两 个 字母 来 表明 语 料 中 所 用 的 具体 修辞 手法 ,如 隐喻 以 <RHEM> 表 示 , 头 韵 以 
二 RHEA> 表 示 , 排 比 以 <RHEP 过 表示 等 。 因 为 CLAWS7 软件 只 能 标注 词类 ， 
上 述 标 注 因 而 不 能 采用 机 器 进行 ,而 只 手工 赋 码 。 创 作 这 些 码 集 的 主要 原因 是 因 
为 它们 所 代表 的 语言 特点 在 旅游 文本 体裁 中 非常 显著 , 且 作用 重大 ,往往 决定 旅游 
文本 的 呼唤 功能 (vocative function) 是 否 能 以 实现 ,因而 有 必要 在 语料库 中 将 这 些 
特点 明示 。 

另外 ,标注 还 涉及 CLAWS] 的 码 集 与 自主 创设 码 的 兼容 问题 。 因 为 作者 并 非 
CLAWS? 的 开发 人 员 , 亦 无 权 将 自 创 的 码 集 加 入 至 CLAWS? 的 码 集 之 中 ,从 而 达 
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到 以 CLAWS? 软件 统一 以 计算 机 附 码 的 目的 。 事 实 上 ,即便 作者 有 权 将 自主 创设 
码 加 入 CLAWS7 的 码 集 , 但 对 于 作者 自主 创设 码 的 标注 (如 修辞 手段 的 标注 ), E 
要 是 基于 对 整个 句子 的 认 知 理解 ,以 目前 人 工 智能 的 发 展 程度 来 看 ,计算 机 亦 不 能 
对 此 附 码 。 为 了 与 CLAWS? 的 码 集 相 兼容 ,我 们 采取 的 手法 是 :在 所 有 的 语 料 用 
CLAWS? 的 码 集 标 注 后 ,再 用 手工 形式 对 处 理 过 的 语 料 加 注 自主 创设 码 。 手 工 赋 
码 费 时 ,但 准确 性 高 。 我 们 力求 在 手工 赋 码 时 做 到 标注 格式 与 CLAWS7 的 码 集 格 
式 完全 一 致 ,以 方便 在 检索 语 料 时 用 软件 统一 提取 。 

第 三 , 语 料 的 对 齐 。PC 里 的 中 英文 语 料 都 先 用 ParaConc 软件 以 句 为 单位 粗 
略 对 齐 , 然 后 再 人 工 检查 ,以 方便 用 concordancer 检索 。 汉 语 语 料 还 会 用 中 科 院 计 
算 所 开发 的 “汉语 词汇 分 析 系 统 ”(ICTCLAS) 进 行 切 分 。 旅 游 文本 的 翻译 很 多 时 
候 并 非 完全 遵守 句 对 名 的 原则 , 摘 译 、 扩 译 或 省 译 情况 还 比较 多 见 。 软 件 在 某 些 地 
方 找 不 到 一 对 一 的 对 应 ,就 容易 发 生 错 配 。 我 们 设想 将 来 在 依照 此 新 型 双语 旅游 
语料库 的 基础 上 ,根据 词 频 来 自主 开发 出 中 、 英 文 旅游 文本 中 常用 的 双语 词汇 
(bilingual lexicon) ,这 样 就 方便 语料库 扩充 和 更 新 时 ,把 这 些 双语 词汇 用 作 语 料 句 
与 句 对 齐 的 另 一 附加 条 件 , 提高 对 齐 的 准确 率 。 但 无 论 如 何 ,机 器 对 齐 之 后 , 均 需 
要 人 工 检查 作 进一步 的 确定 。 对 于 摘 译 、 扩 译 或 是 省 译 的 现象 ,运用 concordancer 
检索 相关 的 句子 时 ,可 以 在 检索 时 设 定 concordancer 同时 出 现 相对 应 的 句子 的 相 
邻 的 几 个 句子 ,提供 更 为 详尽 的 语 境 , 这 样 就 能 较为 准确 的 知道 是 那 一 部 分 原文 受 
到 改动 。 语 料 对 齐 后 ,会 将 文本 转换 成 XML 格式 ,这 样 就 能 让 语料库 以 多 种 语言 
格式 编码 ,方便 传播 和 检索 。 

CC 中 汉语 旅游 语 料 的 词汇 切 分 与 赋 码 亦 是 采用 的 是 由 中 科 院 计算 所 的 
ICTCLAS 软件 。 该 系统 分 词 精度 高 ,分 析 速 度 佳 ,唯一 的 不 足 就 是 对 词性 的 标注 
仍 不 够 精准 。 因 此 ,经 过 ICTCLAS 分 词 后 的 语 料 仍 需 大 量 的 手工 校对 ,以 提高 汉 
语 语 料 的 词性 标注 正确 率 。 

第 四 , 语 料 的 篇 头 标注 。 篇 头 提供 所 收 语 料 的 进一步 信息 。 根 据 不 同 研制 目 
的 ,不 同 语料库 纳入 篇 头 的 内 容 亦 不 同 。 本 语料库 里 ,篇 头 内 容 包括 篇 名 、 作 者 名 、 
作者 背景 译 者 名 、 译 者 背景 年 代 、 出 版 信息 (书籍 .电子 或 图 片 )、 文 本 字数 有 无 
“ 非 言 语 因 素 ” 及 “ 超 音 段 特征 ”等 。 

从 以 上 介绍 可 以 看 出 ,与 传统 的 旅游 语料库 相 比 ,本 语料库 的 “新 ”主要 体现 在 
以 下 几 点 :1 从 语料库 的 结构 成 分 来 看 ,本 语料库 一 反 传统 旅游 语料库 均 由 PC 单 
轨 组 成 的 特点 , 改 为 由 PC 与 CC 联合 双轨 组 成 。 正 如 图 22. 1 所 示 , 这 种 组 合 形式 
能 提 够 更 为 丰富 的 各 子 库 之 间 比 较 的 可 能 性 ,使 研究 者 能 更 全 面 地 考察 旅游 文本 
的 体裁 惯例 ,更 深入 地 了 解 旅游 翻译 与 其 他 类 型 的 翻译 (如 文学 翻译 .法 律 翻 译 等 ) 
在 词汇 ,句法 和 修辞 等 多 个 语言 层面 上 呈现 出 来 的 不 同 特点 ;2) 从 语料库 的 词 容 来 
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看 ,本 语料库 中 的 PC 与 CC 加 起 来 共 200 万 字 , 这 亦 是 目前 世界 上 最 大 的 双语 旅 
游 语料库 。 更 为 重要 的 是 ,本 语料库 建成 之 后 ,每 二 年 将 更 新 一 次 语料库 的 内 容 ， 
使 语料库 能 反映 旅游 语言 的 最 新 变化 。 可 以 设想 ,在 较 长 的 一 段 时 间 之 后 ,语料库 
这 种 动态 的 ,增进 式 (incremental) 的 特点 将 会 使 研究 者 能 够 对 旅游 语言 和 旅游 翻 
译 的 特点 进行 历时 或 共 时 的 研究 ,从 而 丰富 目前 双语 旅游 语料库 研究 中 较为 单一 
的 研究 范式 ;3) 从 语 料 的 收集 上 ,本 语料库 的 语 料 选材 严谨 ,特别 是 针对 双语 旅游 
语 料 良 劳 不 齐 的 普遍 现象 ,提出 双语 语 料 均 需 由 专家 认定 后 才能 入 库 。 这 就 能 避 
免 目前 某 些 双 语 旅游 语料库 中 出 现 的 部 分 收录 译文 错误 百出 的 毛病 ,从 而 在 保证 
本 语料库 的 语 料 具有 代表 性 的 同时 , 亦 不 会 误导 用 户 ;4) 从 语料库 的 运用 前 景 上 ， 
传统 旅游 语料库 作用 相当 单一 ,几乎 都 是 为 旅游 英语 教学 ,尤其 是 词汇 教学 而 设 ， 
而 本 语料库 的 用 途 则 广泛 得 多 : 它 除 了 可 以 采用 DDL 形式 ,开展 多 层次 .多 类 型 的 
旅游 英语 教学 与 中 英 - 英 中 旅游 翻译 教学 之 外 , 亦 可 以 用 于 语言 研究 及 供 旅游 从 业 
人 员 使 用 ,这 样 就 使 双语 旅游 语料库 的 价值 得 到 更 大 的 体现 , 亦 能 给 其 他 专门 语 料 
库 的 研制 和 发 展 提供 宝贵 的 经 验 。 


22.4 小 结 


上 述 以 旅游 语料库 为 例 讨论 专门 双语 对 应 语料库 的 研制 问题 。 这 只 是 研制 的 
一 部 分 工作 ,还 需 不 断 扩充 语 料 ,完善 标注 体系 ,并 根据 研究 和 教学 目的 ,进行 新 的 
语义 和 句法 标注 ,最 大 限度 地 发 挥 语料库 的 潜能 。 在 教学 方面 ,将 根据 语 料 特点 ， 
开发 出 一 系列 可 供 教师 在 课堂 上 使 用 以 及 学 生 随 时 使 用 的 教学 材料 ,为 开展 DDL 
旅游 翻译 教学 提供 直观 和 真实 的 语 料 基础 。 另 外 还 可 以 参照 这 个 专门 语料库 , 建 
立 学 习 者 旅游 翻译 语料库 ,收集 大 学 生 旅游 翻译 作业 的 电子 文本 ,把 它 与 其 他 两 个 
语料库 相对 照 , 找 出 学 生 常 犯 的 错误 ,寻求 产生 这 些 错误 的 文本 内 及 文本 外 的 
原因 。 

专门 双语 对 应 语料库 应 用 前 景 相 当 广阔 。 以 此 库 为 例 ,在 词汇 层面 ,我 们 可 以 
比较 汉 英 旅游 语 篇 的 词汇 色彩 和 风格 (如 是 正式 幽默 低调、 口语 化 还 是 其 他 ,或 
是 通过 词 频 来 统计 出 在 特定 旅游 场景 中 最 常用 的 词汇 ,作为 编纂 不 同 程度 的 旅游 
教材 的 基础 ,或 是 考察 特定 的 形容 词 (如 “美丽 的 ”) 在 译文 中 对 应 的 词汇 ,从 而 挖掘 
旅游 翻译 过 程 中 的 审美 因素 等 。 在 句子 层面 ,可 以 考察 汉 英 旅游 语 篇 在 句子 结构 
和 句子 复杂 程度 的 偏好 ,或 是 研究 句子 选择 主动 或 被 动 表达 式 的 深层 原因 ,或 是 了 
解 句子 在 不 同 的 文化 场合 所 传达 的 不 同 的 语 用 效果 ,所 能 激发 起 读者 不 同 的 文化 
联想 等 :在 语 篇 层面 ,可 以 比较 汉 英 旅游 语 篇 在 衔接 手段 上 的 差别 ,或 是 归纳 出 它 
们 在 语 步 结构 和 体裁 结构 潜 势 上 的 不 同 特点 ,从 而 考察 它们 在 社会 认 知 根源 上 的 
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异同 ;在 修辞 层面 ,还 可 以 比较 汉 英 旅游 语 篇 最 常用 的 修辞 手法 ,考察 读者 对 这 些 
手法 的 接受 和 反应 ,或 是 考察 汉语 旅游 语 篇 中 用 到 的 特定 的 修辞 手法 在 英文 中 的 
习惯 处 理 方法 ,并 了 解 它们 在 译文 读者 大 脑 中 构成 的 或 主观 ,或 客观 .或 夸张 的 印 
象 等 。 这 些 都 是 专门 语料库 研制 后 可 见 的 研究 课题 和 应 用 前 景 。 


第 23 章 


对 应 语料库 的 加 工 处 理 


本 章 围绕 建设 一 个 服务 于 翻译 研究 和 教学 的 语料库 平台 ,提出 了 汉 英 对 应 语 
料 库 的 建 库 及 检索 分 步 处 理 的 系统 架构 ,完成 了 集 句 对 齐 与 校对 于 一 体 的 处 理 界 
面 ,提出 了 对 既往 收集 语 料 的 辅助 校对 策略 方案 。 还 介绍 了 对 对 齐 后 的 双语 句子 
如 何 进 一 步 标注 加 工 与 校对 ,并 转化 为 关系 型 数据 库 形 式 供 检索 调用 。 


23.1 引言 


计算 机 和 网 络 的 发 展 使 人 们 能 够 便捷 地 获取 电子 文本 。 海 量 的 语言 材料 又 进 一 
步 催生 语料库 的 建设 。 当 前 语料库 数量 不 断 增 加 、 加 工 处 理 技术 不 断 更 新 ,一 些 深 
加 工 语料库 不 仅 进行 词性 赋 码 ,还 标注 句法 关系 等 ( 汉 志 伟 2007)。 这 些 都 已 成 为 
语言 研究 及 应 用 的 宝贵 财富 。 由 于 有 单 语 语料库 的 开发 技术 和 机 器 翻译 对 大 规模 
翻译 语 料 的 现实 需求 ,更 多 的 双语 /多 语 语料库 的 研发 已 经 提 到 学 界 的 议事 日 程 。 

双语 语料库 可 分 为 对 应 语料库 、 类 比 语料库 和 翻译 语料库 。 一 般 认为 ,具有 翻 
译 关系 并 且 相 应 文本 之 间 具 有 对 齐 关 系 的 对 应 语料库 对 翻译 的 教学 与 研究 有 效 性 
更 好 。 近 年 来 ,在 教育 部 人 文 社 科 重 点 基地 重大 项 目 和 国家 社 科 基 金 项 目的 支持 
下 ,我 们 规划 设计 并 已 初步 建成 一 个 2000 万 字 词 的 “ 汉 英 对 应 语料库 ”( 王 克 非 
2004a; 王 克 非 2004b; 王 克 非 2004c) ,又 在 此 基础 上 进一步 建设 服务 于 翻译 研究 与 
翻译 教学 的 平台 ( 柯 飞 2002; 王 克 非 等 2007) 。 为 了 使 这 一 宝贵 的 语 料 资源 能 够 尽 
快 为 广大 翻译 教师 和 研究 者 以 及 学 习 者 服务 ,更 好 地 接受 各 界 反馈 以 利于 语料库 
的 发 展 完善 ,2008 年 底 ,北京 外 国语 大 学 中 国外 语 教育 研究 中 心 开设 的 “中 国外 语 
教研 网 "DO 上 发 布 了 包含 200 万 字 词 的 “中 英 双 语 在 线 (CEO) ”语料库 及 其 检索 系 
统 。 通 过 该 检索 入 口 ,用 户 能 够 较 方便 地 利用 已 建成 的 双语 对 应 语料库 中 的 部 分 
测试 资源 。 

本 章 主要 介绍 用 于 翻译 教学 与 翻译 研究 的 汉 英 对 应 语料库 系统 的 设计 架构 ， 


O http://www. fleric. org. cn/ceo/ 
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包括 离线 (offline) 的 课题 组 内 部 的 语 料 对 齐 加 工 及 校对 ,语料库 的 数据 库 转 换 等 
中 间 环 节 。 


23.2 ”对 应 语料库 


总 体 来 看 ,建设 双语 语料库 大 部 分 是 从 统计 机 器 翻译 等 自然 语言 处 理应 用 项 
目 中 发 展 而 来 。 例 如 可 以 对 英法 双语 平行 对 应 语料库 通过 训练 ,获取 源 语 的 语言 
模型 P(S) 和 源 语 向 目标 语 转化 的 翻译 模型 PCT|S) 等 参数 估计 ,并 将 其 用 于 统计 
机 器 翻译 (Brown 1993)。 基 于 实例 的 则 更 是 从 双语 对 应 的 实例 库 中 找 出 与 待 译 部 
分 最 相似 的 翻译 实例 (通常 是 句子 ) ,然后 对 实例 的 译文 通过 捉 蔡 换 , 捉 删除 以 及 串 
增加 等 一 系列 变形 操作 实现 翻译 (Nagao 1984) 。 现 在 越 来 越 多 的 自然 语言 处 理 项 
目 都 离 不 开 各 类 语料库 ,为 此 ,美国 语言 数据 联盟 (Language Data Consortium, 
LDC) CD 和 欧洲 语言 资源 协会 (European Language Resource Association, ELRA)® 
已 经 成 为 协调 和 推动 双语 /多 语 语料库 发 展 的 重要 组 织 。 

对 应 语料库 的 一 些 成 功 应 用 使 得 语料库 建设 在 世界 各 地 蓬勃 发 展 起 来 。 例 如 
利用 加 拿 大 议会 辩论 中 的 英法 语文 文本 建成 的 Hansard 英法 平行 语料库 ,IBM 公 
司 运用 统计 方法 以 及 各 种 对 齐 技术 开发 的 Candide 的 统计 机 器 翻译 系统 ,与 当时 
凝聚 大 量 语言 学 家 和 语言 工程 师 心血 而 研制 的 基于 规则 的 机 器 翻译 系统 Systran 
相 比 ,水 平 相差 无 几 , 从 而 推动 了 语言 工程 领域 经 验 主义 思潮 的 进一步 发 展 (Berge 
1994) 。 自 此 之 后 ,建造 各 类 对 应 语料库 成 为 一 种 基础 工作 。 国 际 上 最 近 一 个 大 项 
目 是 搜集 欧洲 议会 从 1996 年 到 2006 年 11 种 主要 语言 各 约 100 万 句子 构成 的 对 
应 语料库 ,开发 者 宣称 其 目标 就 是 为 统计 机 器 翻译 服务 (Koehn 2005), 

与 此 同时 ,我 国语 言 工程 领域 的 双语 对 应 语料库 发 展 也 得 到 长 足 进步 。 一 些 
主要 的 机 器 翻译 研制 单位 , 像 北 京 大 学 计算 语言 所 .中 科 院 软件 所 、 计 算 所 及 自动 
化 所 、 险 尔 滨 工 业 大 学 、 东 北大 学 以 及 厦门 大 学 等 都 构造 了 规模 大 小 不 等 ,标注 层 
次 不 一 的 英汉 双语 语料库 ,其 目的 是 服务 于 各 自 统计 机 器 翻译 系统 的 模型 参数 的 
训练 要 求 。 鉴 于 当前 自然 语言 处 理 还 是 以 句子 为 单位 ,因此 大 部 分 双语 语 料 是 以 
句 对 (sentence pair) 形 式 出 现 。 

应 该 指出 ,服务 于 机 器 翻译 等 项 目的 双语 句 对 语 料 与 通常 供 翻译 教学 与 研究 
所 用 的 双语 语料库 有 很 大 不 同 ,特别 是 在 以 下 几 个 方面 : 

第 一 ,研制 目的 不 同 。 用 于 统计 机 器 翻译 的 双语 语料库 更 多 地 重视 数量 ,因为 


© http://www. ldc upenn edu/ 
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没有 一 定量 的 语言 事实 材料 ,在 估算 概率 模型 参数 时 会 产生 数据 稀 朴 (data 
sparse) 的 情况 ,进而 形成 统计 偏 倚 ,造成 翻译 错误 ; 供 人 们 教学 和 研究 使 用 的 双语 
语料库 在 保证 量 的 前 提 下 更 多 地 看 重 质 , 因 此 人 工 对 语 料 的 介入 更 多 ,如 对 语 料 进 
行 机 器 加 工 之 后 ,需要 进行 更 多 的 校对 处 理 , 以 保证 语料库 各 类 标注 的 质量 。 

第 二 ,技术 方法 不 同 。 统 计 机 器 翻译 是 以 算法 技术 为 追求 目的 ,通过 提取 模型 
参数 ,选用 统计 算法 ,完成 机 器 的 自动 处 理 。 如 何 实现 不 同 层次 语言 单位 之 间 的 对 
齐 ` 如 何 度量 待 翻译 语言 单位 与 现 有 翻译 单位 的 相似 性 ,是 统计 机 器 翻译 和 基于 实 
例 的 机 器 翻译 重点 考虑 的 技术 路 线 ; 而 供 人 使 用 的 双语 语料库 在 方便 检索 翻译 实 
例 的 前 提 下 ,更 注重 发 挥 人 的 主观 能 动 性 ,发 现 翻译 规律 。 

第 三 ,属性 标注 不 同 。 供 统计 机 器 翻译 用 的 句 对 语 料 注重 源 语言 和 目标 语言 
之 间 的 对 应 性 ,希望 能 对 给 定 某 种 语言 单位 ,通过 对 应 语料库 直接 转换 成 目标 语 的 
相应 译文 ,因此 更 注重 语言 的 对 译 性 ; 供 人 使 用 的 双语 语料库 除 此 之 外 ,还 对 各 类 
其 他 属性 要 求 更 多 ,以 方便 进行 不 同类 别 的 研究 。 璧 如 对 年 代 属 性 进行 历时 分 析 ， 
对 源 语 言 和 目标 语言 属性 进行 英 译 汉 或 汉 译 英 的 分 析 。 

用 来 训练 和 检验 机 器 翻译 系统 句子 翻译 质量 的 海量 句 对 ,可 以 很 方便 地 通过 
Web 方式 获得 ( 叶 莎 妮 等 2008)。 一 些 IT 公司 在 搜集 此 类 语 料 后 ,还 开发 了 免费 
双语 句 对 检索 工具 ,如 爱 词 霸 英 语句 库 @、 句 酷 @ 等 ,采用 搜索 优化 技术 ,能 够 使 用 
户 很 方便 地 在 海量 句 对 中 定位 检索 句子 。 但 遗憾 的 是 其 服务 对 象 为 普通 用 户 , 提 
供 的 检索 界面 比较 简单 ,缺少 对 句子 的 一 些 元 属性 , 比如 翻译 方向 是 英 译 汉 还 是 中 
译 英 ,句子 所 在 篇 章 文本 属性 等 ,对 翻译 研究 和 学 习 者 的 帮助 有 限 。 

从 语言 学 及 翻译 学 研究 出 发 ,也 有 许多 建设 双语 /多 语 语料库 的 典范 ,如 英国 
曼彻斯特 大 学 科技 学 院 1995 年 创建 的 世界 上 第 一 个 翻译 语料库 人 ,收集 从 各 国语 
言 翻译 成 英语 的 文本 ,规模 以 千 万 词 计 , 并 且 语 料 采样 建 库 明确 。 涉 及 英汉 双语 的 
语料库 主要 是 旅居 国外 的 中 国学 者 和 我 国 本 土 学 者 为 主创 建 ,如 兰 卡 斯 特大 学 的 
巴 别 (Babel) 英 汉 平 行 语料库 ,南京 大 学 、 厦 门 大 学 等 也 有 学 者 构建 了 不 同 规模 的 
对 应 语料库 (更 多 语料库 详情 可 参阅 “ 语 料 天 涯 ?@) 。 

我 们 的 “ 汉 英 对 应 语料库 ”建设 ,在 兼顾 机 器 翻译 等 应 用 的 同时 ,更 多 的 是 希望 
给 予 翻译 研究 与 教学 更 多 的 帮助 ,因而 更 倾向 于 为 人 服务 而 不 是 统计 机 器 翻译 的 
替换 操作 。 


http: // dj. iciba. com 
http: // www. jukuu. com 
http: // www. lle. manchester. ac, uk/ctis/research/english-corpus/ 
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23.3 ”双语 对 应 语料库 平台 的 系统 架构 


经 过 项 目 组 研发 人 员 的 多 年 努力 , 北 外 “ 汉 英 对 应 语料库 ”文字 规模 当前 实际 
已 经 达到 3 000 万 字 词 ,其 中 精细 到 词性 赋 码 层次 的 句 对 齐 (alignment) 语 料 有 30 
Fi Xt (sentence pair) ,基本 能 够 满足 日 常 翻译 教学 及 研究 。 目 前 ,有 关 更 多 语 料 
的 搜集 .整理 加工、 校对 等 各 项 工作 还 在 有 条 不 紊 地 进行 之 中 。 

整个 系统 架构 如 图 23. 1 所 示 ,逻辑 上 可 分 为 开发 阶段 的 内 部 离线 的 加 工 建 库 
和 对 外 开放 应 用 阶段 的 外 部 在 线 的 检索 服务 两 个 部 分 。 物 理 上 , 这 两 个 阶段 并 非 
截然 分 开 的 , 建 库 一 直 都 在 进行 ,内 部 不 断 有 新 的 加 工 完善 的 语 料 加 入 ;同时 还 根 
据 外 部 检索 接口 用 户 反馈 内 容 对 语 料 资源 进行 订正 。 外 部 接口 界面 设计 也 接受 用 
于 易 用 性 的 改进 。 


外 部 服务 : 检索 


内 部 加 工 : 建 库 


图 23.1 汉 英 对 应 语料库 架构 设计 


加 工 处 理 是 系统 研发 人 员 将 篇 章 对 齐 的 汉 英 原始 语 料 文本 实施 句子 层面 的 对 
齐 ,将 对 齐 后 的 双语 句子 分 别 做 进一步 的 加 工 ( 如 词性 赋 码 \ 句 法 标注 ); 再 根据 语 
料 库 规划 之 初 设 定 的 标注 属性 (如 标 引 源 语言 及 目标 语言 . 语 体 、 领 域 等 区 别 性 属 
性 ) 和 检索 原则 (如 句子 接受 模糊 查询 ;接受 不 同属 性 组 合 的 多 条 件 复合 查询 等 ) ， 
将 加 工 好 的 句 对 转换 成 关系 型 数据 库 格 式 , 供 上 线 用 户 检索 使 用 这 一 过 程 。 这 是 
一 个 长 期 细致 的 语言 资源 建设 工程 ,不 仅 句 对 数量 多 ,而 且 要 求 标注 质量 高 。 

检索 服务 建立 在 已 创建 的 数据 库 基 础 上 ,是 一 个 人 机 交互 实时 响应 的 过 程 , 系 
统 通过 一 个 人 机 交互 界面 获取 用 户 输入 的 查询 条 件 , 并 对 后 台数 据 库存 储 的 语句 
进行 检索 ,并 返回 相应 结果 。 

虽然 当前 自然 语言 处 理 技术 , 像 双 语句 对 齐 、 词 性 赋 码 及 句法 分 析 等 都 比 以 前 
有 了 长 足 的 进步 ,但 依然 不 能 完全 依赖 这 些 技术 手段 ,实现 全 自动 无 人 值守 的 语 料 
加 工 转化 。 在 语 料 对 齐 建 库 、 加 工 标注 以 及 校对 转换 过 程 中 ,人 工 干预 必 不 可 少 ， 
尤其 有 经 验 的 语言 学 家 的 指导 作用 更 是 不 能 忽视 。 为 帮助 不 熟悉 计算 机 操作 的 语 


224 // ”语料库 翻译 学 探索 


言 学 专业 人 员 能 够 更 方便 快捷 地 参与 工作 ,一 个 良好 的 用 户 人 机 界面 必 不 可 少 。 
我 们 在 整个 语 料 建 库 加 工 处理 过 程 中 ,设计 了 一 整套 辅助 校 核 的 工作 界面 ,使 得 通 
常人 工 处 理 费 时 经 年 且 繁 杂 易 错 的 过 程 变 得 更 为 简单 方便 ,准确 性 也 得 到 保证 。 

建设 一 个 服务 翻译 教学 与 研究 的 应 用 平台 ,需要 经 过 一 系列 步 又 :首先 完成 语 
料 收集 整理 (包括 纸 版 本 语 料 的 电子 化 \ 不 同 格式 文件 的 纯 文本 化 )、. 语 料 对 齐 的 校 
对 处 理 ( 句 对 齐 ), 语 料 加 工 标注 的 校对 ,及 将 校 核 完毕 的 数据 转 存 人 数据 库 。 要 对 
这 个 平台 加 以 利用 则 还 需要 提供 一 个 用 户 访问 获取 该 资源 的 检索 接口 设计 。 本 章 
主要 介绍 内 部 加 工 的 建 库 部 分 ,有 关 用 户 如 何 检索 利用 该 语料库 进行 翻译 教学 与 
研究 ,限于 篇 幅 , 另 文 扎 述 。 


23.4 语 料 对 齐 加 工 、 校 对 及 入 库 


双语 对 应 语料库 的 质量 主要 取决 于 语 料 对 齐 的 质量 和 语 料 各 类 标注 的 质量 。 
语 料 对 齐 可 以 分 为 不 同 层次 ,如 篇 章 级 、 段 落 级 ,句子 级 以 及 短语 、 词 语 级 。 一 般 来 
说 ,层次 越 往 上 ,重复 率 越 低 ,意义 也 较 确定 。 层 次 越 往 下 ,重复 率 越 高 ,意义 更 多 
样 。 到 词语 层面 ,基本 上 就 可 以 看 作 一 个 词 库 。 在 建设 服务 于 翻译 教学 与 研究 的 
双语 平台 项 目 中 ,我 们 主要 开发 了 双语 语 料 的 名 对齐 及 校对 、 人 工 校对 语 料 的 形式 
再 校对 以 及 语 料 标注 属性 校对 等 辅助 工具 ,实现 语 料 及 属性 的 形式 和 内 容 的 校 核 ， 
保证 语料库 质量 ,并 在 此 基础 上 ,将 其 转化 为 数据 库 ,以 便 更 好 地 利用 数据 库 系统 
对 语 料 进行 全 面 管理 和 检索 。 


23.4.1 中 英 双语 语 料 的 句 对 齐 及 校对 


最 初 搜集 未 经 加 工 的 生 语 料 原文 及 对 应 翻译 文本 以 纯 文本 (Plain text) 形 式 分 
开 保存 。 原 文 文本 及 其 翻译 文本 在 命名 设计 上 拥有 相同 且 唯 一 的 文件 名 ,文件 后 
级 冠 以 cn,en 等 区 分 中 英文 文件 。 因 其 名 称 相同 ,才能 保证 原文 和 译文 是 对 应 的 ; 
因 其 唯一 ,才能 区 分 不 同文 件 。 实 际 处 理 时 ,只 需 定 位 找到 具有 相同 文件 名 的 两 个 
文件 , 便 可 确定 该 文本 的 双语 对 应 关系 。 

根据 对 前 期 整理 的 语料库 统计 ( 王 克 非 2004a) ,句子 不 失 为 翻译 的 一 个 主要 转 
换 单位 。 特 别 是 对 非 文学 类 英汉 双向 翻译 及 文学 类 英 译 汉 这 三 类 翻译 ,1:1 的 句 对 
比例 均 达到 80% 以 上 。 即 便 文学 类 汉 译 英 也 有 近 2/3 的 句 对 比例 。 这 一 发 现 给 予 
的 启示 是 :在 双语 文本 段落 已 经 对 齐 的 前 提 下 ,根据 句 末 点 号 拆 分 段落 中 的 每 个 句 
子 ; 如 果 汉 英 双语 文本 中 对 应 段落 的 句子 数目 相同 ,按照 刚才 发 现 的 1:1 对 齐 规律 
直接 将 序号 相同 的 英汉 句子 对 齐 ;如 果 句 子 数 目 不 相 同 , 则 根据 锚 点 (anchor) 词 等 
启发 式 信息 ,同时 借助 一 部 较 好 的 双语 词典 对 相对 较 多 的 句子 进行 归并 对 齐 , 详 情 - 
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另 文 摆 述 。 这 种 简单 的 基准 (baseline) 系 统 的 句 对 齐 准确 率 将 不 低 于 80% 

汉 英 对 应 语料库 是 建设 翻译 教学 与 研究 平台 ,主要 为 人 服务 ;与 当前 大 多 数 对 
齐 系统 服务 于 统计 机 器 翻译 或 实例 机 器 翻译 等 自然 语言 处 理工 程 项 目 不 同 。 机 器 
翻译 等 变 求 海量 数据 ,以 防止 数据 稀疏 可 能 造成 的 统计 错误 ;同时 ,一 些 遗 漏 或 错 
误 将 随 着 数据 量 的 扩大 而 被 统计 算法 沉淀 过 滤 。 而 句 对 对 齐 , 质 量 要 求 更 高 ,因此 
将 简单 有 效 的 对 齐 和 校对 工具 合 二 为 一 。 

如 图 23. 2 所 示 , 在 界面 最 上 方 选择 要 处 理 的 文件 名 ;系统 读 取 用 户 指定 的 中 
英文 对 译文 本 ,根据 基准 处 理 策略 对 汉 英 语句 子 的 粗 对 齐 , 并 将 粗 对 齐 结果 呈现 在 
界面 右上 方 “参考 文档 ”的 文本 框 中 。 用 户 可 以 在 右 下 方 的 按钮 区 顺序 或 逆序 对 文 
本 中 每 个 句子 进行 遍历 操作 。 当 前 正在 编辑 的 句 对 中 的 中 英文 句子 实例 呈现 在 界 
面 左 部 ;例如 本 例 中 英 句 对 比 是 5:3。 现 在 假定 用 户 已 经 将 第 1 句 汉语 和 第 1 句 英 
文 作为 对 齐 链接 ;当前 要 将 第 2,3 两 句 汉语 句子 和 第 2 句 英文 句子 做 2:1 的 对 齐 ， 
则 可 以 通过 选 定 汉 语句 子 列表 框 (Listbox) 中 的 第 2 一 3 行 和 英文 句子 列表 框 中 的 
第 2 行 , 单 击 “ 对 齐 ” 按 钮 完成 ;执行 结果 将 呈现 在 界面 下 部 的 “对 齐 句 对 ”文本 编辑 
框 中 。 如 果 用 户 确认 该 结果 , 单 击 “ 保 存 "按钮 , 则 将 以 新 的 对 齐 结果 替代 机 器 粗 对 
齐 结果 ;如 果 不 认可 还 可 以 在 该 编辑 框 中 重新 处 理 , 直 到 满意 为 止 。 针 对 图 23. 2 
中 原始 5:3 的 粗 切 分 ,经 过 人 工 干预 后 ,将 构成 新 的 1:1,2:1,2:1 的 对 齐 格局 。 


py 
BAREFOOT CONTESSA</p> 


fi} 
| PEEN « RE MIGRAINE </> 
SR ESS Disadara Duncan freed modern dance fron the ballet </p> 
<p>Dance, sometunes caled the is aso the wave loo 

Es:s] 
| Ther prophet was Isadora Duncan (1878-1927), who raged was | |p mai, BERAR. OCREARNET, BARAT 


“paramos eee TARNE 


Dire cece RRNA ORES. THRAMST APOE RIOR, | 


[om a) Ce 
tte | 
| Ce 


图 23. 2 语料库 句子 对 齐 校对 界面 


语 料 对 齐 校对 辅助 系统 的 好 处 在 于 :1) 对 齐 校对 界面 无 需 用 户 输入 过 多 的 文 
字 内 容 , 例 如 句 对 中 的 中 英文 的 句 数 由 程序 自动 计算 列表 框 中 的 用 户 选 定 行 数 确 
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定 , 对 齐 句子 的 文本 复制 也 由 系统 自行 完成 ,因此 可 以 杜绝 人 工 不 熟练 导致 误 操作 
形成 的 格式 或 字面 上 的 错误 ;2) 工 作 界 面 的 核心 区 域 集中 在 当前 编辑 的 句 对 ,并 且 
一 直 在 右 侧 提供 包含 当前 句 对 的 上 下 文 语 境 ,可 以 通过 向 前 向 后 按钮 实现 遍历 ,这 
样 防止 由 于 文本 章 件 过 大 ,文字 过 多 造成 的 遗漏 检查 ;3) 采 用 标准 Windows 鼠标 
操作 ,使 得 校对 更 快 更 方便 ,提高 工作 效率 ,加 快 工作 进程 。 


23.4.2 ”中 英 双 语 语 料 前 期 人 工 对 齐 校对 的 再 校对 


语料库 建设 有 一 个 不 断 深入 的 长 期 整理 加 工 过 程 。 在 这 个 过 程 中 , 语 料 数量 
不 断 累积 ,处 理 手段 也 有 更 新 。 针 对 不 同 阶段 创建 加 工 的 语 料 需要 有 一 个 一 致 化 
的 处 理 。 

双语 对 应 语料库 创建 之 初 ,曾经 人 工 校对 过 一 批 经 程序 自动 对 齐 的 语 料 。 但 
当时 还 没有 开发 合适 的 辅助 校对 工具 ,翻译 专业 人 员 在 对 句 对 对 齐 质量 把 关 的 同 
时 ,还 是 或 多 或 少 ,不 可 避免 地 留 下 了 因 计 算 机 操作 不 熟练 或 长 期 伏案 工作 、 精 力 
分 散 而 导致 的 格式 方面 的 错误 。 对 这 部 分 历史 遗留 语 料 的 校对 与 上 文 介绍 的 一 体 
化 处 理 策略 不 同 , 着 重 在 发 现形 式 错误 。 

每 一 份 英汉 对 齐 语 料 都 采用 类 XML 表示 设计 ,分 为 文件 头 (head) 和 文件 体 
《body) 等 两 个 不 同 部 分 ( 常 宝宝 等 2003)。 文 件 头 包括 该 文件 的 标题 .作者 名 、 出 
版 社 . 时 间 、 语 言及 源 语言 和 文体 、 领 域 等 都 柏林 核心 集中 规定 的 元 数据 
CMetadata) 属 性 。 文 件 体 是 文件 的 主要 内 容 , 由 若干 个 中 英 句 对 簇 构成 。 

名 对 簇 是 由 句 对 类 型 引出 随后 紧 跟 互 为 对 应 的 若干 中 英文 句子 构成 。 句 对 类 
型 是 由 开 闭 符号 “〖”“】” 括 住 的 一 对 数值 , 形 如 X: Y; 其 中 XX 表示 当前 对 齐 的 句 对 
汉语 句子 个 数 ,Y 表示 相应 的 英文 句子 数 。 数值 X,Y 决定 随后 的 中 英文 句子 个 
数 。 按 照 对 应 语料库 对 齐 的 设计 规范 ,每 个 句子 各 占 一 行 , 则 X 及 Y 的 取 值 决定 
了 随后 若干 行文 本 是 否 属于 同一 句 对 比 。 因 此 句 对 簇 是 表示 汉 英 对 应 句子 数 的 元 
信息 和 汉 英 对 英 句 子 信息 内 容 的 结合 体 。 

从 形式 上 看 ,每 行 行 首 标识 为 集合 {( 国 、 售 .@@. 一 :之 } 中 的 任 一 取 值 ; 其 中 带 国 
的 行 表示 文件 名 的 信息 ; 合 行 是 段落 开始 标识 ;银行 中 的 数字 表示 为 英汉 对 齐 单元 
中 各 自 的 句子 个 数 ;其 余 所 有 行 都 以 <s 之 开始 表示 一 个 汉语 或 英文 句子 ;<s 人 > 二 
p> 表 示 段 首 句 。 行 尾 标识 为 集合 (外 一 /s 之 、】、@@} 中 的 任 一 取 值 ; 

有 关 语 料 形式 方面 的 再 校对 的 重点 有 纯 形式 方面 的 错误 和 与 内 容 相关 的 形式 
错误 。 前 者 包括 1) 文 本 格式 的 规范 化 ,譬如 删除 多 余 出 来 的 空白 行 ;2) 将 所 有 的 
软 回 车 (\r) 统 一 换 作 硬 回 车 (\n);3) 将 行 尾 标识 与 行 首 标识 误 拼 接 的 重新 拆 分 。 
后 者 包括 由 于 对 原始 语 料 的 对 齐 句 对 进行 过 调整 ,而 元 数据 信息 却 没有 修正 ,造成 
内 容 与 形式 的 脱节 ,譬如 原来 语 料 中 英文 句 对 数 为 1:2, 在 将 第 二 个 英语 句子 挪 出 
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后 ,实质 形成 1:1 的 对 应 关系 ,但 没有 对 句 对 应 数 更 改造 成 元 数据 信息 不 能 反映 实 
际 对 齐 句子 的 情况 。 

针对 纯 形 式 方面 的 错误 ,可 以 简单 地 采用 全 局 统一 蔡 换 的 方式 ,如 软 硬 回 车 的 转 
变 和 空白 行 的 删除 ,借助 行 首 及 行 尾 标识 符 也 可 以 方便 识别 是 否 有 行 尾行 首 的 误 拼 
接 ;针对 元 数据 信息 和 句 对 中 英 句子 的 校对 采用 如 图 23. 3 所 示 的 处 理 方法 解决 。 


输入 : 待 校对 文件 ; 
输出 : 定位 文件 中 句 对 数 元 数据 信息 与 中 英文 实际 对 齐 句子 不 匹配 的 内 容 
处 理 流程: 
0) 打 开 待 校对 文件 ， 指 针 指向 文件 头 ;设置 计数 单位 CnNum，EnNum, 初 始 为 夫 ; 
设置 字符 串 CnSent EnSent 为 空 ; 
(2) 当 文件 指针 不 指向 文件 尾 ， 转 (3)， 否 则 转 (6); 
(3) 著 当前 行 包含 | X:Y | ,为 对 应 句 数 元 数据 信息 ， 其 中 X,Y 为 整数 ; 


如 果 X!=CnNum 或 YI=EnNum， 则 输出 CnSent 及 EnSent; 
ECoNumREnNum# $, CnSentREnSenty SH; 转 (2); 
(4) SWAT HEASCUB AT 128044, AAT, CoNumiin; 
CnSent 加 入 当前 行 ， 转 (2); 
(5) 若 当前 行 不 存在 ASCII 码 大 于 128 的 字符 ， 剂 断 为 英语 ，EnNum 累 加 ; 
EnSent 加 入 当前 行 ， 转 (2); 
(6) 关 闭 文件 ， 志 出 应 用 程序 。 


图 23. 3 人 工 校对 语 料 元 数据 信息 再 校对 处 理 描述 
针对 每 一 个 待 再 校对 的 人 工 已 校对 文件 , 先 处 理 纯 形式 方面 的 错误 ,再 按照 图 
23. 3 的 操作 流程 ,从 前 往 后 扫描 文本 ,根据 元 数据 信息 的 提示 ,获取 随后 句 对 簇 中 
的 对 应 句 数 ,如 果 标 识 的 句 对 数 与 实际 句 对 数 不 一 致 , 则 将 该 部 分 内 容 输出 , 供 工 
作 人 员 检查 校对 。 由 此 我 们 能 得 到 一 个 既 内 容 准确 (因为 经 过 早期 的 人 工 校对 )， 
又 形式 合法 (由 于 机 器 辅助 的 形式 再 校对 ) 的 新 语 料 。 


23.4.3 ”句子 标注 加 工 及 校对 


经 过 上 述 句 对 齐 及 校对 之 后 ,中 英文 句子 之 间 的 句 对 应 关系 可 以 确定 ,能 够 从 
任 一 语言 的 句子 出 发 检索 出 相应 的 原文 或 译文 。 这 一 阶段 的 对 应 语 料 还 是 未 经 加 
工 的 生 语 料 ,例如 汉语 文本 未 经 分 词 处 理 ; 而 英文 文本 也 没有 经 过 词类 赋 码 。 因 
此 ,未 经 加 工 的 生 语 料 可 能 导致 语 料 检索 的 准确 度 降低 。 璧 如 只 能 实现 基于 字 而 
不 是 基于 词 的 检索 ,如 果 要 检索 “华人 ”可 能 检索 出 “中 华人 民 共 和 国 ” 等 这 种 包含 
带 检 索 字 串 的 内 容 。 另 一 个 不 便 之 处 是 检索 方式 也 受 限 , 璧 如 无 法 要 区 分 不 同 词 


228 // 语料库 翻译 学 探索 


性 的 同一 词 形 , 像 要 分 开 检 索 作 为 介词 的 “把 ?和 作为 动词 的 “把 ”, 如 果 语 料 未 经 分 
词 和 词类 冉 码 , 则 根本 就 无 能 为 力 。 因 此 有 必要 对 已 经 句 对 齐 的 中 英文 句子 进行 
适当 的 深加工 ,以 满足 用 户 不 同 颗粒 度 的 检索 需求 。 

在 本 测试 语 料 中 ,我 们 利用 中 科 院 计算 所 的 分 词 系统 开源 版 本 了 ,采用 北京 大 
学 计算 语言 学 研究 所 的 汉语 文本 词性 标注 标记 集 , 对 汉语 文本 进行 了 词类 赋 码 处 
理 ;与 此 类 似 ,利用 Treetagger@ 对 英文 文本 进行 了 相应 的 词类 赋 码 处 理 (Helmut 
1994) 。 虽 然 这 些 赋 码 工具 的 准确 性 都 达到 了 很 高 的 程度 ,但 我 们 设计 的 对 应 语 料 
库 是 将 被 用 户 当 作 翻译 教学 与 研究 参考 用 的 经 典 规 范 语料库 ,因此 需要 增加 必要 
的 校对 工作 。 

我 们 设计 了 一 个 对 句子 词类 赋 码 及 元 信息 属性 校对 的 辅助 环境 ,工作 界面 如 
图 23.4 所 示 。 在 屏幕 上 方 显著 位 置 分 别 显示 已 赋 码 的 中 英文 句子 。 下 方 显示 该 
名 所 在 篇 章 的 篇 名 \ 作 者 名 、 篇 章 类 型 及 写作 时 间 的 等 元 信息 。 其 中 ,篇 名 及 作者 
名 不 可 编辑 ,只 用 于 对 其 他 可 编辑 元 信息 的 检查 提示 。 在 文本 框 出 现 的 中 英文 句 
子 可 以 直接 编辑 修改 ,其 他 以 多 选 框 形式 出 现 的 元 信息 可 以 重新 选择 确定 。 由 于 
句子 标注 的 结果 是 “ 词 十 码 ” 的 混合 字符 串 形 式 , 当 句 子 较 长 时 , 词 码 混杂 显示 不 太 
容易 看 出 分 词 词 类 的 结果 , 单 击 “不 显示 词类 ”按钮 , 则 弹出 只 含有 分 词 词 形 的 句子 
结果 ,这 样 能 够 直观 地 观察 分 词 结果 。 


TI 


asor 
| [ECC the_DT smal scale 7) agrcuture_NN and_CC the_ DT smal_0 handira NN production NN 
prosperous days MS mas, VBO now „RÐ shrunk WN had. 


图 23. 4 词类 赋 码 及 元 信息 加 工 校对 


© http: // www. nlp. org. cn/project/project. php?proj_id=6 
© http://www. ims, uni-stuttgart, de/projekte/corplex/TreeTagger/ 
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完成 对 中 英文 句子 的 词类 赋 码 以 及 该 句 对 的 语种 、 源 语言 ,文本 类 型 及 写作 领 
域 等 元 信息 的 校对 之 后 ,就 可 以 考虑 将 汉 英 句 对 以 及 附着 其 上 的 元 数据 内 容 转化 
为 关系 型 数据 库 ,以 利用 数据 库 系统 来 进行 组 织 管理 。 


23.4.4 数据 库 设计 


为 简化 开发 时 间 ,我 们 在 目前 的 汉 英 对 应 语料库 系统 中 采用 关系 型 数据 库 架 
构 。 这 是 因为 数据 库 一 来 有 较 好 的 数据 存储 及 管理 及 维护 功能 ,二 来 也 提供 较 好 
的 检索 服务 机 制 ,三 来 还 具有 方便 的 二 次 开发 接口 设计 。 在 本 项 目 中 ,双语 对 应 语 
料 库 实际 上 设计 为 数据 库 中 的 一 个 表 (table) 。 该 表 是 由 一 个 个 汉 英 对 应 句子 及 其 
他 属性 构成 的 记录 (record) 组 成 。 其 中 对 每 条 记录 而 言 ,数据 库 定义 为 包括 如 表 
23. 1 所 示 的 字段 (field, 属 性 信息 。 


表 23.1 数据 库 字段 设计 及 说 明 


字段 名 类 型 备 注 
英文 句 字符 型 (5000) 一 个 英文 句子 不 超过 5 000 字母 
汉语 名 字符 型 (2000) 一 个 汉语 句子 不 超过 2000 汉字 
源 语言 字符 型 (1) 当前 句子 的 源 语言 (英语 或 汉语 ) 
类 型 字符 型 (1) 当前 句子 所 属 的 类 型 ( 取 规 定 值 之 一 ) 
文体 EZE 当前 句子 所 属 的 文体 ( 取 规 定 值 之 一) 
语 体 字符 型 (1) 当前 句子 所 属 的 语 体 ( 取 规定 值 之 一 ) 
时 代 字符 型 (1) 当前 句子 所 属 的 时 代 ( 取 规定 值 之 一 ) 
段落 ID 数值 型 当前 句子 所 在 段落 相对 全 文 偏 移 量 
句子 ID 数值 型 当前 句子 相对 段落 的 偏 移 量 
文件 名 字符 型 (50) 当前 句子 所 在 文件 名 


在 以 上 数据 库 字段 的 规划 中 ,最 主要 的 内 容 是 “英文 句 " 和 “汉语 句 ”, 分 别 存 人 
互 有 对 应 关系 的 完整 的 英语 或 汉语 句子 。 为 标准 简单 划一 起 见 ,当前 对 句子 的 判 
定 以 名 末 点 号 为 准 ,如 {。1?} 等 。 英 汉人 句子 都 分 别 进行 了 词类 赋 码 ,数据 库 记 录 中 
存放 的 是 带 码 的 词 串 ,设计 英文 句子 包含 空格 在 内 长 度 不 超过 5 000 个 字母 ,汉语 
句子 最 多 不 超过 2000 个 汉字 。 当 前 这 只 是 个 经 验 值 , 给 可 能 的 最 长 句子 预 留 。 如 
果 万 一 遇 到 比 预 留 长 度 更 长 的 句子 , 则 可 以 考虑 将 该 名 分 拆 以 满足 长 度 限制 要 求 。 

其 他 字段 记录 的 是 当前 句 对 出 处 的 文本 属性 及 句子 在 原始 文本 中 的 偏 移 量 等 
元 信息 。 辟 如 可 以 从 该 句 源 语言 的 属性 可 以 推 知 “ 英 译 汉 ” 还 是 “ 汉 译 英 ”; 从 文体 
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属性 可 推 知 是 文学 体 还 是 非 文学 体 等 。 在 对 语料库 进行 检索 或 过 滤 时 ,可 以 根据 
这 些 字段 属性 加 以 各 类 综合 条 件 的 限制 ,从 而 得 到 所 需 结果 。 


23.5 小 结 


我 们 建造 完成 了 迄今 为 止 规模 最 大 、 经 过 专业 人 员 精 心 校 对 的 英汉 双语 对 齐 
(句子 层面 ) 平 行 语料库 。 为 使 这 一 宝贵 资源 能 够 更 好 地 服务 于 翻译 研究 和 翻译 教 
学 ,已 经 推出 Web 方式 的 原型 测试 检索 系统 ,并 得 到 了 许多 正面 的 建设 性 的 意见 
和 建议 。 

我 们 将 继续 搜集 新 的 有 代表 性 的 双语 语 料 ,对 其 进行 对 齐 、 标 注 及 校对 等 加 工 
工序 ,并 不 断 充实 到 双语 对 应 语料库 中 ,进一步 扩大 量 的 规模 ;同时 根据 用 户 相关 
反馈 ,修正 语料库 设计 ,进一步 提升 标注 正确 率 和 校对 效率 ,使 语料库 的 建设 更 贴 
近 用 户 实际 需求 。 


(1) 


[2] 


[3] 


[4] 
[5] 


[6] 


[7] 


[8] 


[9] 


[10] 


[11] 


[12] 


参考 文献 


Aarts, J. (1999), The description of language use [A], In H. Hasselgrd and S. 
Oksefjell (eds. ), Out of corpora; studies in honor of Stig Johansson [C], Amsterdam; 
Rodopi, 3-20, 

Alcantar, C. (2007), Construction of a Special Corpus to Extract the Most Frequent 
Words in a Particular Field [J], Essex Graduate Student Papers in Language and 
Linguistics (9); 1-17. 

Anderman, G. and M. Rogers. (2003), Translation Today: Trends and perspectives 
[C], Clevedon; Multilingual Matters Ltd. 

Anderson, H. (1973), Abductive and deductive change [J], Language 49; 765-793, 
Bahumaid, S. (2006), Collocation in English-Arabic Translation [J], Babel 52(2): 133- 
152. 

Baker, M. (1992), In Other Words: A Coursebook on Translation [M], London: 
Routledge. 

Baker, M. (1993), Corpus Linguistics and Translation Studies; Implications and 
Applications [A], In M, Baker, G.. Francis and E. Tognini-Bonelli (eds. ), Text and 
Technology: In Honour of John Sinclair [C], Philadelphia and Amsterdam; John 
Benjamins, 233-250. 

Baker, M. (1995), Corpora in translation studies; An overview and some suggestions for 
future research [J], Target 7(2) : 223-243. 

Baker, M. (1996), Corpus-based translation studies; the challenges that lie ahead [A], 
In H. Somers (ed.), Terminology, LSP, and translation [C], Amsterdam; John 
Benjamins, 175-186. 

Baker, M. (1998a), Réexplorer la langue de la traduction: une approche par corpus [J], 
Meta 43(4); 480-485. 

Baker, M. (1998b), Routledge Encylopedia of Translation Studies [Z], London and 
New York; Routledge. 

Baker, M. (1999), The role of corpora in investigating the linguistic behaviour of 
professional translation [J], International Journal of Corpus Linguistics (2): 281-298, 


232 // ”语料库 翻译 学 探索 


[13] 


[14] 


[15] 


[16] 


[17] 


[18] 


[19] 


[20] 


[21] 


[22] 


[23] 


[24] 


[25] 


Baker, M. (2000), Towards a Methodology for Investigating the Style of a Literary 
Translator [J], Target 12(2); 241-266, 

Baker. M. (2004), The treatment of variation in corpus-based translation studies [A], In 
K. Aijmer and H. Hasselgrd (ed. ), Translation and Corpora [C], Acta Universitatis 
Gothoburgensis, 7-17. 

Barlow, M. (2000), Parallel Text in Language Teaching [C], InS, P. Botley, A. M. 
McEnery and A. Wilson (eds. ), Multilingual Corpora in Teaching and Research [C], 
Amsterdam: Rodopi, 106-115. 

Barnbrook, G. , P. Danielsson and M. Mahlberg (eds. ), (2006), Meaning ful Texts: 
The Extraction of Semantic Information from Monolingual and Multilingual Corpora 
[C], London and New York; Continnum. 

Bell, R. T. (1991), Translation and Translating; Theory and Practice [M], London 
and New York; Longman. 

Benson, P. (2001), Teaching and Researching Autonomy in Language Learning [M], 
Harlow; Pearson Education. 

Berger, A. , Brown, P. and S, Peitra, et al. (1994), The Candide System for Machine 
Translation [A], In Proceedings of the Workshop on Human Language Technology 
[C], Plainboro, NJ. 1994, 157-162. 

Bernardini, S. (1997), Trainee translator’s perspective on corpora [A], Paper presented 
at Corpus Use and Learning to Translate held at Bertinoro, November, Available on-line 
at URL http: // www. sslmit unibo, it/introduz, htm, 

Bernardini, S. (20042), Corpora in the classroom; An overview and some reflections on 
future developments [A], In J. M. Sinclair (ed. ), How to Use Corpora in Language 
Teaching [C], Philadelphia: John Benjamins, 15-36. 

Bernardinin, S. (2004b), Corpus-aided language pedagogy for translator education [A], 
In K. Malmjer (ed.), Translation in Undergraduate Degree Programmes [M], 
Amsterdam: John Benjamins, 97-112. 

Bernardini, S. (2005), Reviving old ideas: parallel and comparable analysis in translation 
studies—with an example from translation stylistics [A], In K. Aijmer and C. Alvstad 
(eds. ), New Tendencies in Translation Studies, Selected Papers from a Workshop 
Goteborg 12 December 2003 [C], Guteborg: Acta Universitatis Gothoburgensis, 5-18. 
Bernardini, S. and F. Zanettin (2004), When is a universal not a universal? Some limits 
of current corpus-based methodologies for the investigation of translation universals [A], 
In A. Mauranen and P. Kujamaki (eds. ), Translation Universals—Do They Exist? [C], 
Amsterdam; John Benjamins, 51-62. 

Bernardini, S. , et al. (2003), An introduction. In F. Zanettin et al. (eds, ) Corpora in 
Translator Education [C], Manchester: St. Jerome Publishing. 


[26] 


[27] 


[28] 
[29] 


30] 


31] 


32] 


[33] 


[40] 


[42] 


参考 文献 // 233 


Blum-Kulka, S. and E. A. Levenston. (1983), Universals of lexical simplification [A], 
InC. Furch and G. Kasper (eds. ) Strategies in Interlanguage Communication [C], 
London and New York; Longman, 119-139. 

Blum-Kulka, S. (1986), Shifts of cohesion and coherence in translation [C], In J. House 
and S. Blum-Kulka (eds. ), Interlingual and Intercultural Communication. Discourse 
and Cognition in Translation and Second Acquisition Studies [C], Tübingen: Gunter 
Narr, 61-71. 

Boase-Beier, J. (2003), Mind Style Translated [J], Style 37(3); 253-265, 

Boase Beier J. (2004), Translation and style: A brief introduction [J], Language and 
Literature 13 (3); 9-11. 

Boase-Beier, J. (2006), Stylistic Approaches to Translation [M], Manchester: St. 
Jerome. 

Bosseaux, C. (2004), Point of View in Translation: A corpus-based study of French 
translations of Virginia Woolf’s To the Lighthouse [J], Across Languages and Cultures 5 
(1); 107-122. 

Bowker, L. (1998), Using specialized monolingual native-language corpora as a 
translation resource; A pilot study [J], Meta (43)4; 631-651. 

Bowker, L. (2003), Corpus-based applications for translator training: Exploring the 
possibilities [A], In S. Granger et al. (eds, ), Corpus-based Approaches to Contrastive 
Linguistics and Translation Studies [C], Amsterdam; Rodopi, 169-183, 

Brinton, L. J. and E. C. Traugott (2005), Lezicalization and Language Change [M], 
Cambridge: Cambridge University Press. 

Brown, P., V. Pietra and S. Pietra (1993), The Mathematics of Statistical Machine 
Translation; Parameter Estimation [J], Computational Linguisitcs (19); 263-311. 
Catford, J. C. (1965), A linguistic theory of translation [M], Oxford: OUP. 

Chanell, J. (1980), Applying Semantic Theory to Vocabulary Teaching [J], ELT 
Journal, 35(2), 115-122, 

Li, C. and S. Thompson (1981), Mandarin Chinese: A Functional Grammar [M], 
Berkley: University of California Press. 

Chen, H. (1994), The contextual analysis of Chinese sentences with punctuation marks 
[J], Literary and Linguistic Computing 9(4): 281-289, 

Chesterman, A. (1997), The memes of translation [M], Amsterdam: John Benjamins, 
Chesterman, A. (2000), A Causal model for translation studies [A], In M. Olohan 
(ed. ), Intercultural faultlines. Research models in translation studies I; Textual and 
cognitive aspects [C], Manchester; St Jerome, 15-27. 

Chesterman, A. (2004a), Beyond the particular [A], In A. Mauranen and P. Kujamaki 
(eds. ), Translation Universals; Do They Exist? [C], Amsterdam: John Benjamins, 33- 


234 / 语料库 翻译 学 探索 


[43] 


[44] 


45] 


46] 


[47] 


48] 


[49] 
50] 


[51 


[52] 


[53 


[54 


[55 


[56 


49. 

Chesterman, A. (2004b), Hypothesis about translation universals [A], In G. Hansen, 
K. Malmkjaer and D. Gile (eds.), Claims, Changes and Challenges in Translation 
Studies [C], Amsterdam: John Benjamins, 1-13, 3 
Chesterman, A. (2005), Toward Consilience? [A], In K. Aijmer and C. Alvstad 
(eds. ), New Tendencies in Translation Studies [M], Goteborg: Acta Universitatis 
Gothoburgensis, 19-27. 

Chujo, K., M. Utiyama and K. Oghigian. (2006), Selecting Level-Specific Kyoto 
Tourism Vocabulary Using Statistical Measures [R], Paper presented at Conference of 
2006 International Teaching and Learning ; New Aspect of English Language Learning in 
Taiwan. Available online at URL: http; // www2. nict go. jp/x/x161/members/mutiyama/ 
pdf/Kyoto-Article-Chujo-Utiyama-Oghigian. pdf. 

Cowie, P, (1994), Phraselogy. In R. Asher (ed. ), The Encyclopedia of Language and 
Linguistics [C], Oxford: Pergamon, 3168-3171. 

€raciunescu, O. , et al. (2004), Machine Translation and Computer-Assisted Translation: 
a New Way of Translating? [J], Translation Journal 8(3) http; //translationjournal, net/ 
journal //29computers. htm 

Crisafulli, E. (2002), The quest for an eclectic methodology of translation description 
CA], In T. Hermans (ed. ), Crosscultural Transgressions ; Research Models in Translation 
Studies II [C], Manchester; St. Jerome, 26-43. 

Croft, W. (1990), Typology and Universals [M], Cambridge; CUP. 

Crystal, D. (1999), The Penguin Dictionary of Language [Z], London: Penguin 
Books. 

Davidse, K. and L. Heyvaert. (2003), On the middle construction in English and Dutch. 
In Granger, S., J. Lerot and S. Petch-Tyson. (eds.), Corpusbased Approaches to 
Contrastive Linguistics and Translation Studies. Amsterdam: Rodopi, 57-73. 
Deutscher, G. (2002), On the misuse of the notion of ‘abduction’ in linguistics C1. 
Journal of Linguistics 38: 469-485. 

Dickinson, L. (1987), Self-instruction in Language Learning [M], Cambridge: 
Cambridge University Press. 

Duff. Alan. (1981), The Third Language: Recurrent problems of translation into 
English [M], Oxford: Pergamon Press. 

Ebeling, J. (1998), Contrastive linguistics, translation, and parallel corpora [J], Meta 
43 (4): 602-615. 

Englund-Dimitrova, B (2003), Explicitation in Russian-Swedish translation; sociolinguistic 
and pragmatic aspects [A], In B. Englund-Dimitrova and A. Pereswetoff-Morath (eds. ) ， 
Swedish Contributions to the Thirteenth International Congress of Slavists, Ljubljana, 


(57) 


[58] 


[59] 
[60] 


[61] 


[62] 


[63] 


[64] 


[65] 


L66] 
L67] 


C68] 


[69] 


参考 文献 // 235 


15-21 August, 2003 [C], Lund: Lund University, 21-31. 

Englund-Dimitrova, B. (2005). Expertise and Explicitation in the Translation Process 
[M], Amsterdam; John Benjamins. 

Eskola, S. (2004). Untypical frequencies in translated language: A corpus-based study 
on a literary corpus of translated and non-translated Finnish [A], In A. Mauranen and P. 
Kujamaeki (eds. ), Universals in Translation. Do they exist? [C], Amsterdam: John 
Benjamins, 83-99, 

Firth, J. (1957). Papers in Linguistics [M], London; OUP. 

Francis, W. N. and H. Kuaera (1982), Frequency Analysis of English Usage: Lexicon 
and Grammar [M], Boston; Houghton Mifflin. 

Frankenberg-Gacia, A. (2004), Are translations longer than source texts? A corpus- 
based study of explicitation [A], Paper presented at the Third International CULT 
(Corpus Use and Learning to Translate) Conference, Barcelona, 22-24 January, 2004, 
http: // www. linguateca. pt/Repositorio/Frankenberg-Garcia2004, doc (accessed 07/04/ 
2006) 

Frawley, W. (1984), Prolegomenon to a theory of translation [A], In W, Frawley 
(ed. ), Translation: Literary, linguistic and philosophical perspectives [C], London 
and Toronto: Associated University Press, 159-175. 

Friedbichler, L and M. Friedbichler, (1997), The potential of domain-specific target- 
language corpora for the translator’s workbench [A], Paper presented at the Conference 
of Corpus use and learning to translate held at Bertinoro, Novembe 1997, 

Gaussier eric, et al. (2000), Term Alignment in Use; Machine-Aided Human Translation 
[A], In Véronis, Jean (ed.), Parallel Text Processing Alignment and Use of 
Translation Corpus [C], Cordrecht; Kluwer Academic Publishers, 253-274, 

Gellerstam, M. (1986), Translationese in Swedish novels translated from English [A], 
In L. Wollin and H. Lindquist (eds, ), Translation Studies in Scandinavia [C], Lund; 
CWK Gleerup; 88-95. 

Granger, S., J. Lerot and S. Petch-Tyson. (2003), Corpus-based Approaches to 
Contrastive Linguistics and Translation Studies [M], Amsterdam; Rodopi. 

Halverson, Sandra. (2003), The cognitive basis of translation universals [J], Target 15 
(2); 197-241. 

Hansen, S and Teich, E (2001), Multi-layer analysis of translation corpora; methodological 
issues and practical implications [A], In D. Cristea, N. Ide, D. Marcu and M. Poesio 
(eds), Proceedings of EUROLAN 2001 Workshop on Multi-layer Corpus-based Analysis 
[C], Iasi, Romania, 44-55. 

Hantson, A. (2003), English gerund clauses and Norwegian det + infinitive/at clause 
constructions. In Granger, S., J. Lerot and S. Petch-Tyson (eds. ), Corpus-based 


236 // ”语料库 翻译 学 探索 


[70] 


[71] 


[72] 


[73] 


[74] 


[75] 


[76] 


[77] 


78] 


[79] 
[80] 
[81] 


[82] 


[83] 
[84] 


[85] 


Approaches to Contrastive Linguistics and Translation Studies. Amsterdam: Rodopi, 
75-90. f 

Hatim, B. and L Mason. (1990/2001), Discourse and the Translator [M], Shanghai: 
Shanghai Foreign Language Education Press, 

Hatim, Basil. (2001), Teaching and Researching Translation [M], Harlow; Pearson 
Education. 

Helmut Schmid, (1994), Probabilistic Part-of-Speech Tagging Using Decision Trees 
[A], In International Conference on New Methods in Language Processing. [C], 
Manchester, UK: 44-49 

Hermans, T. (ed.) (2002), Crosscultural Transgressions: Research models in 
translation studies [] ; Historical and ideological issues [C], Manchester: St. Jerome. 

Hermans, T. (1996), The Translator’s Voice in Translated Narrative [J], Target 8(1): 
23-48, 

Hermans, T. (1999), Translation in systems [M], Manchester; St Jerome. 

Hermans, T. (2002), Paradoxes and aporias in translation and translation studies [A], 
In A. Riccardi (ed. ), Translation Studies: Perspectives on an Emerging Discipline 
[C], Cambridge: Cambridge University Press: 10-23, 

Hobbs, J. (2004), Abduction in natural language understanding [A], In L. R. Horn 
and G. Ward (eds.), The handbook of pragmatics [C], London and New York; 
Blackwell, 724-741, 

Holmes, J. S. (1972/1988), The name and nature of translation studies [A], In J. S. 
Holmes, Translated! Papers on literary translation and translation studies [M], 
Amsterdam; Rodopi, 67-80. 

Hoover, D. L. (2007), Corpus Stylistics, Stylometry, and the Styles of Henry James 
DJ, Style 41(2); 174-203. 

Hopkinson, C. (2007), Factors in linguistic interference; A case of study in translation 
[J], Skase Journal of Translation and Interpretation 2(1); 13-23. 

Hudson, R. A. (1996/2000), Sociolinguistics [M], Beijing: Foreign Language 
Teaching and Research Press, 

Huiming Yang. (2006), Blended learning—a new business English solution [J], US- 
China Foreign Language, (9) :67-71. 

Hunston, S. and G. Francis. (2000), Pattern grammar [M], Amsterdam; John Benjamins, 
Hunston, S. (2002), Corpora in Applied Linguistics [M], Cambridge: Cambridge 
University Press, 

Johansson, S. and K. Hofland. (1994), Towards an English-Norwegian Parallel Corpus 
[A], In U. Fries, G. Tottie and P, Schneider (eds), Creating and Using English 
Language Corpora [C], Amsterdam: Rodopi, 25-37. 


[86] 


[87] 


[88] 


[89 


[90 


[91] 


[92] 


[97] 


[98] 


[99] 


[loo] 


参考 文献 // 237 


Johansson, S. (1991), Times Change and so do Corpora [A], In K. Aijmer and B. 
Altenberg (eds), English Corpus Linguistics; Studies in Honour of Jan Svartvik [C], 
London and New York; Longman, 305-314. 

Johansson, S. (1998), On the role of corpora in cross-linguistic research [A], In S, 
Johansson and S. Oksefjell (eds), Corpora and Cross-Linguistic Research [C], 
Amsterdam: Rodopi, 1-24. 

Johansson, S. (2003), Reflections on corpora and their uses in cross-linguistic research 
CA], In F. Zanettin, S. Bernardini and D. Stewart (eds), Corpora in Translator 
Education [C], Manchester; St. Jerome, 135-144. 

Johansson, S. (2004), Why change subject? On changes in subject selection in 
translation from English into Norwegian [J], Target 16 (1); 29-52. 

Johansson, S. (2007), Seeing Through Multilingual Corpora [M], Amsterdam; John 
Benjamins. 

Johns, T. and King P. (1991), Classroom Concordancing [C], ELR Journal, New 
Series 4. 

Kennedy, G. (1998), An Introduction to corpus linguistics, London; Longman. 
Kenny, D. (1998), Creatures of habit? What translators usually do with words [J], 
Meta 43 (4); 1-9. 

Kenny, D. (1999), Translators at play; exploitations of collocational norms in German- 
English translation [A], In B. Dodd (ed.), Working with German Corpora [C], 
Birmingham; University of Birmingham Press, 143-160, 

Kenny, D. (2000), Lexical hide-and-seek: looking for creativity in a parallel corpus 
[A], In M. Olohan (ed.), Intercultural faultlines. Research models in translation 
studies I; Textual and cognitive aspects [C], Manchester; St Jerome, 93-104. 

Kenny, D. (2001), Lexis and Creativity in Translation; A Corpus-based Study, [M], 
Manchester: St. Jerome Publishing. 

Kenny, D. (2005), Parallel corpora and translation studies; old questions, new perspectives? 
Reporting that in Gepcolt: a case study [A], In G. Barnbrook, P. Danielsson and M, 
Mahlberg (eds. ), Meaning ful Texts: The Extraction of Semantic Information from 
Monolingual and Multilingual corpora [C], London; Continuum, 154-165, 

Klaudy, K. and K. Károly (2005), Implicitation in Translation; Empirical Evidence for 
Operational Asymmetry in Translation [J], Across Languages and Cultures, 6 (1); 13- 
28. 

Klaudy, K. (1998/2004), Explicitation [A], In M. Baker (ed ), Routledge Encyclopedia 
of Translation Studies [Z], Shanghai: Shanghai Foreign Language Education Press, 80- 
84. 

Koehn, P. (2005), Europarl; A Parallel Corpus for Statistical Machine Translation 


238 


[101] 


[102] 


[103] 


(111) 


[112] 


(113) 


[114] 


[115] 


/ “语料库 翻译 学 探索 


[A], Proceedings of 10th Machine Translation Summit [C]. 

Kubler, N. (2003), Corpora and LSP Translation [A], In F. Zanettin, S Bernardini 
and D. Stewart (eds), Corpora in Translator Education [C], Manchester: St. Jerome, 
25-42, 

Kuhn, T. (1962), The structure of scientific revolutions [M], Chicago: University of 
Chicago Press. 

Laham, D. (1997), Latent Semantic Analysis Approaches to Categorization [A], In M. 
G. Shafto and P. Langley (eds. ) Proceedings of the 19th Annual Conference of the 
Cognitive Science Society. [C] Hillsdale, NJ: Lawrence Erlbaum Associates, 979, 
Landauer, T. K, , P. W. Foltz, and D. Laham (1998), Introduction to Latent Semantic 
Analysis [J], Discourse Processes (25): 259-284. 

Laviosa, S. (1997), How comparable can comparable corpora be? [J], Target 9: 289- 
319. 

Laviosa, S. (19982), The Corpus-based Approach: A New Paradigm in Translation 
Studies [J], Meta (43/4): 474-479, 

Laviosa, S. (1998b), The English comparable corpus: a resource and a methodology 
[A], In L. Bowker, M. Cronin, D. Kenny and J. Pearson (eds. ), Unity in Diversity? 
Current Trends in Translation Studies [C], Manchester; St. Jerome: 101-112. 
Laviosa, S. (1998c), Core patterns of lexical use in a comparable corpus of English 
narrative prose [J], Meta 43(4); 557-570, 

Laviosa, S. (2002), Corpusbased Translation Studies: Theory, Findings and 
Applications [M], Amsterdam; Rodopi. 

Laviosa, S. (2003), Corpora and translation studies [A], In S, Granger, Jacques Lerot 
and Stephanie Petch-Tyson (eds. ), Coprus-based approaches to contrastive linguistics 
and translation studies [C], Amsterdam: Rodopi: 45-54, 

Laviosa-Braithwaite, S. (1998/2004), Universals of translation [A], In M. Baker 
Ced.), Routledge Encyclopedia of Translation Studies [Z], Shanghai; Shanghai 
Foreign Language Education Press, 288-291. 

Leech, G. and M. Short (1981/2001), Style in Fiction; A Linguistic Introduction to 
English Fictional Prose [M], Beijing: Foreign Language Teaching and Research Press. 
Leech, G. , P. Rayson and A, Wilson. (2001), Word Frequencies in Written and 
Spoken English based on the British National Corpus [M], Harlow andLondon; 
Pearson Education. 

Leech, G. (1997), Teaching in language corpora: a convergence [A], In G Knowles, 
T. McEnery, S. Fligelstone, and A. Wichman (eds. ), Teaching and language Corpora 
[C], London: Longman, 1-22. 

Li, D. (2004), Trustworthiness of Think-aloud Protocols in the Study of Translation 


[116] 


[117] 


C118] 


[119] 


[120] 


[121] 


[122] 


[123] 


[124] 


[125] 


[126] 


[127] 


[128] 


[129] 


[130] 


参考 文献 // 239 


Process [J], International Journal of Applied Linguistics (3): 301-313, 

Maia, B. (1998), Word order and the first person singular in Portuguese and English 
[J], Meta 43(4) 589-601. 

Maia, B. (2003), Some languages are more equal than others: training translators in 
terminology and information retrieval using comparable and parallel corpora [A], In F. 
Zanettin, S Bernardini and D. Stewart. Corpora in Translator Education [C], Manchester: 
St. Jerome, 43-53, 

Malmkjaer, K. (2003), What happened to God and the angels; An exercise in translational 
stylistics [J], Target 15(1); 37-58. 

Malmkjaer, K. (2004), Translational stylistics; Dulcken’s translations of Hans 
Christian Andersen [J], Language and Literature 13(1): 13-24. 

Malmkjær, K. (2005), Linguistics and the Language of Translation [M], Edinburgh: 
EUP 

Manning, C. D. and H. Schütze (2005),《 统 计 自然 语言 处 理 基础 并 M], 苑 春 法 ,等 译 . 
北京 :电子 工业 出 版 社 . 

Marco, J. (2004), Translating style and styles of translating: Henry James and Edgar 
Allan Poe in Catalan [J], Language and Literature 13(1): 73-90. 

Mason, Ian, (2001), Translator behavior and language usage: Some constraints on 
contrastive studies [J], Hermes (26): 65-80. 

Mauranen, A. and P. Kujamaki (eds. ), (2004), Translation Universals: Do They 
Exist [C], Amsterdam: John Benjamins. 

Mauranen, A, (2002), Where’s cultural adaptation, A corpus-based study on translation 
strategies [A], http: // www. intralinea, it/(accessed 27/11/2005) 

Monzó, E. (2003), Corpus-based teaching; The use of original and translated texts in 
the training of legal translators [J], Translation Journal, (7) 4. Available on-line at 
http: // accurapid, com/journal/26edu. htm. 

McEnery, T. and M. Oakes. (1996), Sentence and word alighment in the CRATER 
project [A], In J. Thomas and M. Short (eds. ) Using Corpora for Language Research 
[C], London; Longman, 211-231, 

McEnery, T. and R. Xiao. The Lancaster Corpus of Mandarin Chinese (LCMC) [O] 
http: // www. lancs. ac. uk/fass/projects/corpus/LCMC/. Last Retrieved on September 
15, 2009. 

Millan-Varela, C. (2004), Hearing voices; James Joyce, Narrative Voice and Minority 
Translation [J], Language and Literature 13(1); 37-54, 

Monzó, E. (2003), Corpus-based teaching: The use of original and translated texts in 
the training of legal translators [J], Translation Journal (4), Available on-line at http: 
/accurapid. com/journal/26edu. htm. 


240 


[131] 


[132] 


[133] 


[134] 


[135] 


[136] 


137] 


[138] 


139] 


[140] 


141] 


[142] 


143] 


144] 


[145] 


C146] 


(1473 


U ”语料库 翻译 学 探索 


Nagao, M. (1984), A framework of a mechanical translation between Japanese and 
English by analogy principle [A], In A. Elithorn and R. Banerji (eds. ) Artificial and 
Human Intelligence [C], Amsterdam: North-Holland, 173-180. 

Newman, A. (1980), Mapping translation equivalence [M], Leuven: ACCO. 

Nida, E. A. and C. Taber, (1969), The Theory and Practice of Translation [M], 
Leiden; E. J. Brill, 

Nida, E. A. (1964/2004), Toward a Science of Translating [M], Shanghai; Shanghai 
Foreign Language Teaching Press. 

Nord, C. (2005), Text Analysis in Translation; Theory, methodology, and didactic 
application of a model for translation-oriented text analysis (2nd edition) [M], 
Amsterdam; Rodopi. 

Olohan, M. and M. Baker (2000), Reporting that in Translated English; Evidence for 
Subconscious Processes of Explicitation [J], Across Languages and Cultures 1(2): 141- 
158. 

Olohan, M. (2001), Spelling out the Optionals in Translation: A corpus study [J], 
UCREL Technical Papers 13: 423-432. 

Olohan, M. (2002), Leave it out! Using a comparable corpus to investigate aspects of 
explicitation in translation [J], Cadernos de Traducao 9: 153-169, 

Olohan, M. (2003), How frequent are the contractions? A study of contracted forms in 
the Translational English Corpus [J], Target 15 (1), 59-89. 

Olohan, M. (2004), Introducing Corpora in Translation Studies [M], London and 
New York; Routledge. 

Overis, L. (1998), In Search of the Third Code: An Investigation of Norms in Literary 
Translation [J], Meta, 43 (2): 571-588, 

Paloposki, O, (2001), Enriching translations, simplified language? An alternative 
viewpoint to lexical simplification [J], Target 13 (2); 265-288. 

Papineni, K. , and S Roukos (2002), Bleu: a Method for Automatic Evaluation of 
Machine Translation. [C] Proceedings of the 40th Annual Meeting of the Association 
for Computational Linguistics (ACL), Philadelphia, July 2002, 311-318, 

Pearson, J. (2003), Using parallel texts in the translator training environment [A], In 
F, Zanettin, S, Bernardini and D, Stewart (eds. ) Corpora in Translator Education 
[C], Manchester: St. Jerome, 15-24. 

Peirce, C. S. (1931-1966), The collected papers of Charles Sanders Peirce [1839- 
1914] [C], (8 vols. ) Cambridge, MA: Harvard University Press. 

Popper, Karl. (1979), Objective Knowledge: An Evolutionary Approach [M] (revised 
edition). Oxford: Oxford University Press. 

Puurtinen, T. (1998), Syntax, readability and ideology in children’s literature Cy), 


[148] 


[149] 


[150] 


[151] 
[152] 
[153] 


[154] 


[155] 


[156] 


[157] 


[158] 


E159] 


参考 文献 // 241 


Meta 43 (4); 524-533. 

Puurtinen, T. (2003a), Genre-specific features of translationese? Linguistic differences 
between translated and non-translated Finnish children’s literature [J], Literary and 
Linguistic Computing. 18 (4): 389-406. 

Puurtinen, T. (2003b), Non-finite constructions in Finnish children’s literature: 
features of translationese contradicting translation universals [A], In S. Granger, J. 
Lerot and S, Petch-Tyson (eds. ), Corpusbased Approaches to Contrastive Linguistics 
and Translation Studies [C], Amsterdam, Rodopi, 141-154. 

Puurtinen, T. (2004), Explicitation of clausal relations; A corpus-based analysis of 
clause connectives in translated and non-translated Finnish children literature [A], In 
Anna Mauranen and Pekka Kujam Ki (eds. ), (2004), Translation Universals; Do They 
Exist? [C] Amsterdam; John Benjamins, 165-176, 

Pym, A. (2003), Redefining Translation Competence in an Electronic Age: In Defense 
of a Minimalist Approach [J], Meta 43(4); 481-497. 

Quirk, R., S. Greenbaum, G. Leech and J. Svartvik (eds. ) (1972), A Grammar of 
Contemporary English [M], London; Longman. 

Riccardi, A. (2002), Translation Studies; Perspectives on an emerging discipline 
[M], Cambridge: Cambridge University Press, 

Santos, D. and A. Frankenberg-Garcia, (2007), The corpus, its users and their needs, 
a user-oriented evaluation of COMPARA [J], International Journal of Corpus 
Linguistics 12(3) ; 335-374, = 
Santos, D. (1995), On grammatical translationese [A], In K. Koskenniemi (ed. ), 
Short Papers Presented at the Tenth Scandinavian Conference on Computational Linguistics 
[C], Helsinki; 59-66, . 

Schmied, J. and H. Schaffler. (1997), Explicitness as a universal feature of translation 
[A], In M. Ljung (ed.), Corpusbased Studies in English. Papers from the 17th 
International Conference on English Language Research on Computerized Corpora 
(ICAME 17), Stockolm, May 15-19, 1996 [C], Amsterdam: Rodopi. 

Semino, E. and M. Short. (2004), Corpus Stylistics; Speech, Writing and Thought 
Presentation in a Corpus of English Writing [M], London; Routledge. 

Serpellet, N. (2002). Mandative constructions in English and their equivalents in 
French: applying a bilingual approach to the theory and practice of translation [A], In 
B. Kettemann and G. Marko (eds.), Teaching and Learning by Doing Corpus 
Analysis. Proceeding of the Fourth International Conference on Teaching and 
Language Corpora [C], Amsterdam, 345-360, 

Shlesinger, M. (1998). Corpus-based interpreting studies as an offshoot of corpus-based 
translation studies [J], Meta (43)4; 486-493. 


242 


[160] 
[161] 
[162] 
C163] 
[164] 


[165] 


[166] 


[167] 


[168] 


C169] 


[170] 


[171] 


[172] 


[173] 
[174] 


[175] 


U “语料库 翻译 学 探索 


Shuttleworth, M. and M. Cowie (1997), Dictionary of Translation Studies [Z], 
Manchester; St. Jerome Publishing. 

Sinclair, J. M. (1991/1999), Corpus, concordance. collocation [M], Shanghai; 
Shanghai Foreign Language Education Press. 

Sinclair, J. M. (1996), Howto Use Corpora in Language Teaching [M], Amsterdam; 
John Benjamins, 

Snell-Hornby, M. (2006), The Turns of Translation Studies; New paradigms or 
shifting viewpoints [M], Amsterdam: John Benjamins. 

Stubbs, M. (1986), Language development, lexical competence and nuclear vocabulary 
[A], In K. Durkin (ed) Language Development in the School Years [C], Croom Helm, 
Stubbs, M. (1993), British tradition in text analysis from Firth to Sinclair [A], In ML 
Baker, G. Francis and E. Tognini-Bonelli (eds), Text and Technology: In Honour of 
John Sinclair [C], Amsterdam: John Benjamins, 1-33. 

Tirkkonen-Condit, S. (2002), Translationese—A myth or an empirical fact? A study 
into the linguistic identifiablity of translated language [J], Target 14 (2), 207-220, 
Tirkkonen-Condit, S. (2004), Unique items—over- or underrepresented in translated 
language [A], In A. Mauranen and P, Kujameki (eds. ), Translation Universals—Do 
They Exist? [(C]Amsterdam; John Benjamins, 177-184, 

Tognini-Bonelli, E. (2001), Corpus Linguistics at Work [M], Amsterdam; John 
Benjamins. 

Toury, G. (1978), The Nature and Role of Norms in Literary Translation [A], In J. 
S. Holmes, J. Lambert and R. van den Broeck, (eds. ) Literature and Translation, 
New Perspectives in Literary Studies [C], Leuven: Acco, 83-100. 

Toury, G. (1980), In Search of a Theory of Translation [M], Tel Aviv; The Porter 
Institute for Poetics and Semiotics. 

Toury, G. (1995/2001), Descriptive Translation Studies and Beyond [M], Shanghai; 
Shanghai Foreign Language Education Press. 

Toury, G. (2004), Probabilistic explanations in translation studies; universals—or a 
challenge to the very concept [A], In G. Hansen, K. Malmkjaer and D. Gile (eds. ), 
Claims, Changes and Challenges in Translation Studies. Selected Contributions for the 
EST Congress, Copenhagen, 2001 [C], Amsterdam: John Benjamins, 15-25. 
Trosborg, A. (ed. ), (1997), Text Typology and Translation [C], Amsterdam; John 
Benjamins, 

Trudgill, P. (1983), Sociolinguistics: An Introduction to Language and Society [M], 
Harmondsworth: Penguin Books. 

Tsao, F. (1979), A Functional Study of Topic in Chinese [M], Taipei: Student Book 
Co. 


[176] 


[177] 


C178] 


C179] 


[180] 


[181] 
[182] 


[183] 


184] 


185] 


[186] 
(187) 


188] 


[189] 


[190] 


[191] 


参考 文献 // 243 


Turney, P, D. (2005), Measuring semantic similarity by latent relational analysis. [C] 
Proceedings of the Nineteenth International Joint Conference on Artificial Intelligence 
(CYCAL05), Edinburgh, Scotland, 1136-1141. 

Tymoczko, M. (1998), Computerized corpora and the future of translation studies [J J, 
Meta 43(4); 652-660, 

Tymoczko, M. (2005), Enlarging translation theory: Integrating Non-western thoughts 
about translation [A], In T. Hermans. Translating Others [C], Manchester: St. 
Jerome, 13-32. 

Tytler, A. (1907/2007), Essays on Principles of Translation [M], Beijing: Foreign 
Language Teaching and Research Press, 

Ure, J. (1971), Lexical density and register differentiation [A], In G. E. Perren and J. 
L. M. Trim (eds.), Applications of linguistics: selected papers of the Second 
International Congress of Applied Linguistics [C], Cambridge: Cambridge University 
Press, 443-452, 

Vanderauwera, R. (1985), Dutch Novels Translated Into English. Amsterdam; Rodopi. 
Venuti, L. (1995), The translator’s Invisibility; A History of translation [M], 
London: Routledge. 

Véronis, J. (ed. ), (2000), Parallel Text Processing: Alignment and Use of 
Translation Corpus [C], Cordrecht; Kluwer Academic Publishers. 

Veronis, J. (2000), From the Rosetta stone to the information society: a survey of 
parallel text processing [A], In J. Véronis (ed. ), Parallel Text Processing : Alignment 
and Use of Translation Corpus [C], Cordrecht; Kluwer Academic Publishers, 1-24, 
Vinay, J. and J. Darbelnet. (1958/1995), Comparative Stylistics of French and 
English. A Methodology for Translation [M], Translated and edited by J. C. Sager 
and M. -J. Hamel. Amsterdam: John Benjamins, 

Wales, K. (2001), A Dictionary of Stylistics [Z], London; Longman. 

Wichmann, A. , S Fligelstone, A. McEnery, and G. Knowles (eds), (1997), Teaching 
and Language Corpora [C], London; Longman. 

Wilkinson, M. (2005), Discovering Translation Equivalents in a Tourism Corpus by 
Means of Fuzzy Searching [J], Translation Journal (9); 1-10, 

Wilkinson, M. Compiling a specialized corpus to be used as a translation aid [OL], 
available online at URL http; // www. joensuu, fi/hallinto/jopke/dokumentit/ Wilkinson, 
doc 

Wynne, M. (2005), Stylistics: corpus approaches [OL], Available at: www. pala, ac. 
uk/resources/sigs/corpus-style/Corpora_stylistics. pdf (accessed 22-10-2008) 

Xiao, Z and T. McEnery (2002), A corpus-based approach to tense and aspect in 
English-Chinese translation [R], Paper presented at International Symposium on 


244 


人 ”语料库 翻译 学 探索 


Contrastive and Translation Studies between Chinese and English, Shanghai, 2002. 
Zanettin, F. (1998), Bilingual comparable corpora and the training of translators [A], 
Meta (4): 4-14, 

Zanettin, F. , S. Bernardini and D. Stewart (eds), (2003), Corpora in Translator 
Education [C], Manchester: St. Jerome. 

常 宝 宝 、 柏 晓 更 . (2003) ,北京 大 学 汉 英 双语 语料库 标记 规范 [J],《 汉 语 语言 与 计算 学 报 》 
13(2) 195-214, 

陈 定安 . (1995),《 英 汉 比 较 与 翻译 )LM] ,北京 :中 国 对 外 翻译 出 版 公司 . 

陈国华 . (1997) , 论 莎 剧 重 译 ( 下 )[]],《 外 语 教学 与 研究 )(3) ;48-54. 

BERIK. (2004) 《新 编 汉 英 翻 译 教程 )CM], 上 海 : 上 海外 语 教育 出 版 社 . 

陈 瑞 清 .(2004) , 汉 译 文本 的 形 合 趋势 ;以 语料库 为 本 的 翻译 学 研究 [A],《 第 九 届 口 笔译 
教学 研讨 会 论文 集 )LC] ,台南 : 长 荣 大 学 翻译 学 系 . 

程 雨 民 (编著 ),(1989), 人 《英语 语 体 学 )CMJ, 上 海 :上 海外 语 教育 出 版 社 . 

METI. (2002) ,汉语 代词 “他 ”的 句 内 照应 规则 研究 [MA] ,北京 大 学 汉语 系 硕士 论文 . 
范 仲 英 . (1997),《 实 用 翻译 教程 [MD] ,北京 :外 语 教学 与 研究 出 版 社 

封 一 函 . (2001) ,教室 网 络 申 的 交互 式 翻译 教学 []],《 中 国 翻译 》(2) :37-39. 

封 宗 颖 、 邵 志 洪 . (2004) ,英汉 第 三 人 称 代词 深层 回 指 对 比 与 翻译 []],《 外 语 学 刊 . (5): 
95-100. 

WRH. (1997) ,《 实 用 翻译 教程 [MJ], 上 海 :上 海外 语 教 育 出 版 社 . 

冯 志 伟 . (1996) ,《 自 然 语言 的 计算 机 处 理 )[M], 上 海 : 上 海外 语 教育 出 版 社 . 

With. (2001), 中 国语 料 库 研究 的 历史 与 现状 [A],《 国 际 汉语 计算 机 会 议 1CCC2001 论 
文集 汇 C] ,新 加 坡 . 

冯 志 伟 . (2007), 基 于 经 验 主义 的 语料库 研究 []], 术 语 标准 化 与 信息 技术 )(1) :29-36. 
高 照明 . (2004), 汉 英 近 义 句 翻译 检索 , 载 王 克 非 等 著 ,双语 对 应 语料库 :研制 与 应 用 》 
[MD ,北京 :外 语 教学 与 研究 出 版 社 ,69-79. 

WA. (2004) ,计算 机 辅助 翻译 教学 的 一 种 尝试 [站 ,《 外 语 界 )(5) :54-61. 

何 兆 武 . 李 约 瑟 ( 译 ).(1963/1980),( 西 方 哲学 史 》( 罗 素 原 著 )[M], 北 京 :商务 印 书馆 . 
BBR. (2003) ,英汉 翻译 过 程 中 的 显 化 现象 []],《 解 放 军 外 国语 学 院 学 报 》(4) :63-66. 
贺 阳 . (2004), 从 现代 汉语 介词 中 的 欧 化 现象 看 间接 语言 接触 [J],《 语 言 文字 应 用 )(4)， 
82-89. 

胡 开 宝 、 朱 一 凡 . (2008) ,基于 语料库 的 莎 剧 (哈姆雷特 } 汉 译文 本 中 显 化 现象 及 其 动因 
研究 [JJ],《 外 语 研究 )(2) :72-80. 

胡 显 耀 . (2005) ,用 语料库 研究 翻译 的 普遍 性 []],《 解 放 军 外 国语 学 院 学 报 )(3) :45-48. 
HEM. (2007) ,基于 语料库 的 汉语 翻译 小 说 词语 特征 研究 [J],《 外 语 教学 与 研究 )(3) ， 
214-219, 

BEBE. (2008) ,《 现 代 汉语 语料库 翻译 研究 LM] ,上海 :外 文 出 版 社 . 

黄 伯 荣 、 廖 序 东 ( 主 编 ). (2002) 《现代 汉语 下 》( 增 订 第 三 版 )[Z], 北 京 :高 等 教育 出 版 社 . 


[217] 
[218] 
[219] 
[220] 


[221] 
[222] 
[223] 
[224] 
[225] 
[226] 


[227] 


[228] 
[229] 
[230] 
[231] 
[232] 
[233] 
234] 
[235] 
[236] 
[237] 
[238] 
[239] 
[240] 


[241] 
[242] 
[243] 
[244] 
245] 
[246] 


[247] 


参考 文献 / 245 


黄 昌 宁 .(2002), 人 语料库 语言 学 并 M] ,北京 :商务 印 书馆 . 

黄 立 波 、 王 克 非 . (2006) ,翻译 普遍 性 研究 反思 [中 ,中 国 翻译 (5) :36-40. 

黄 立波 , 柯 飞 . (2005), 从 多 个 视角 探究 翻译 [站 《外语 与 翻译 )(2) :14-17. 

黄 立波 . (2007), 基 于 汉 英 \ 英 汉 平 行 语料库 的 翻译 共性 研究 )CM] ,上海 : 复 旦 大 学 出 版 
4. 

PASTE. (2008) ,英汉 翻译 中 人 称 代词 主语 的 最 化 [],《 外 语 教学 与 研究 》(6) 454-459, 
柯 飞 , (2002a) ,双语 库 :翻译 研究 新 途径 []],《 外 语 与 外 语 教学 》(9) :35-39. 

柯 飞 , (2002b) , 语 料 , 网 路 与 口 笔译 教学 []],《 外 语 教学 与 研究 (3) 231-232, 

柯 飞 . (2003) ,汉语 把 字句 特点 、 分 布 及 英 译 研究 []],《 外 语 与 外 语 教学 》(12) :1-5. 

柯 飞 . (2005) ,翻译 中 的 隐 和 显 [四 ,人 《外语 教学 与 研究 )X(4) :303-307 

克 里 斯 特 尔 。 WUE (Ba). (2000) ,现代 语言 学 词典 》( 第 四 版 )(A Dictionary of Linguistics 
and Phonetics), 沈 家 迷 译 ,北京 :商务 印 书馆 . 

李 德 超 、 王 克 非 . (2009) ,平行 文本 比较 模式 与 旅游 文本 的 英 译 []],《 中 国 翻译 ?28(4) 
54-58, 

李 德 凤 、 胡 枚 . (2006) ,学 习 者 为 中 心 的 翻译 课程 设置 []], 人 外 国语 )(2) 59-65. 

连 淑 能 . (1993/2002),《 英 汉 对 比 研究 )LM] ,北京 :高 等 教育 出 版 社 

JBC. (2000) ,语料库 与 翻译 研究 []],《 外 语 教学 与 研究 )32(5) :380-384. 

廖 七 一 . (2001) ,( 当 代 英 国 翻译 理论 )CM] ,武汉 :湖北 教育 出 版 社 . 

林 煌 天 .2005),《 中 国 翻 译 词典 汇 Z], 武 汉 :湖北 教育 出 版 社 . 

葡 瑛 . (1997) ,现代 汉语 介词 的 语法 作用 []],《 语 文 研究 )(2). 

刘 康 龙 , 穆 雷 . (2006) ,语料库 语言 学 与 翻译 研究 []],《 中 国 翻译 (1) ,59-64. 

刘 礼 进 .(1997) ,英汉 人 称 代词 回 指 和 预 指 比较 研究 []],《 外 国语 》(6) :40-44. 

刘 密 庆 . (2002) ,( 文 体 与 翻译 CMJ, 北京 :中 国 对 外 翻译 出 版 公司 

刘 密 庆 , (2005),《 中 西 翻 译 思想 比较 研究 )LM] ,北京 :中 国 对 外 翻译 出 版 公司 

刘 士 聪 . 2002), 人 汉 英 英汉 美文 翻译 与 鉴赏 )CM] ,南京 : 译 林 出 版 社 . 

陆 俭 明 、 马 真 . (1985),《 现 代 汉 语 虚 词 散 论 )CMD] ,北京 :北京 大 学 出 版 社 . 

昌 俊 . (2002) ,翻译 学 应 从 解构 主义 那里 学 什么 一 一 对 九 十 年 代 中 期 以 来 我 国 译 学 研究 
的 反思 [中],《 外 国语 》(5) :48-54. 

SUH CED. (1980/1999) 《现代 汉语 八 百 词 ( 增 订 本 )[M], 北 京 :商务 印 书馆 . 
BUH ATER. (1979) ,《 语 法 修辞 讲话 [MJ, 北 京 :中 国 青年 出 版 社 . 

罗 选 民 . (2001) 《话语 分 析 的 英汉 语 比 较 研究 并 MJ, 长 沙 :湖南 人 民 出 版 社 . 

马 建 忠 . (1986) ,《 马 氏 文通 读本 )CM], 上 海 :上海 教 育 出 版 社 . 

钱 军 等 (译注 ),(2001) ,( 雅 柯 布 森 文 集 》( 罗 曼 。 雅 柯 布 森 著 )[LM] ,长 沙 :湖南 教育 出 版 社 . 
秦 洪 武 . 柯 飞 . (2004) ,基于 语料库 的 翻译 语言 分 析 一 一 以 “so. .. that” 的 汉语 对 应 结构 
为 例 [中 《现代 外 语 》27(1) :40-48. 

RRR EHAE. (2007) ,对 应 语料库 在 翻译 教学 中 的 应 用 :理论 依据 和 实施 原则 []],《 中 
国 翻译 》(5):43-48. 


246 


[248] 


[249] 
[250 
[251] 
[252] 
` [253 
[254] 
[255] 
[256] 


[257] 
[258] 
[259] 
[260] 
(261 


[262] 
[263] 
[264] 
[265] 
[266] 
[267] 
[268] 
[269] 
[270] 
[271] 
[272] 


[273] 


[274] 


人 ”语料库 翻译 学 探索 


秦 洪武 . 王 克 非 . (2004) ,基于 语料库 的 翻译 语言 分 析 一 一 以 so. .. that 的 汉语 对 应 结构 
为 例 []],《 现 代 外 语 》(1) :44-52. 

FERETE. (2002) ,从 形 合意 合 看 汉 英 翻译 的 形式 对 应 []],( 中 国 翻译 (3) :33-35. 

邵 志 洪 . (2005) ,《 汉 英 对 比 翻 译 导 论 )[ 中 ,上 海 ; 华 东 理工 大 学 出 版 社 . 

申 丹 ( 编 ).(2008) ,《 西 方 文体 学 的 新 发 展 )[C], 上 海 :上 海外 语 教育 出 版 社 . 

申 丹 . (1995) ,《 文 学 文体 学 与 小 说 翻译 )[M], 北 京 :北京 大 学 出 版 社 . 

申 丹 . (2000) 《西方 现代 文体 学 百年 发 展 历程 )[]],《 外 语 教学 与 研究 》. 

MEZ. (2003) , 形 合 与 意 合 的 语 用 意义 及 翻译 策略 []],《 外 国语 )(2) :67-73. 

BIR. (2002),《 译 道 探 徽 江 M] ,北京 :中 国 对 外 翻译 出 版 公司 . 

宋 志平 . (2003) ,英汉 语 形 合意 合 对 比 研究 综观 [站],《 东 北 师 大 学 报 ( 哲 社 版 )》(2) ;92- 
98. 

谭 载 喜 . (2005)《 翻 译 学 )[M] ,武汉 :湖北 教育 出 版 社 . 

王 灿 龙 .(2000), 人 称 代词 “他 ”的 照应 功能 研究 [ 由 《中 国语 文 X3) ;228-237. 

EA. (1985) ,《 王 力 文集 (第 二 卷 )[M], 济 南 :山东 教育 出 版 社 . 

EH. (1989),《 中 国 现代 语法 )LM], 北 京 :商务 印 书馆 . 

EF. (2003) ,关于 本 科 翻 译 教学 的 再 思考 一 探索 “以 学 习 者 为 中 心 ”的 翻译 教学 模式 
的 一 次 尝试 []],《 外 语 界 》(1) :17-25. 

王 克 非 秦 洪武 . 王 海 震 . (2006) ,双语 对 应 语料库 翻译 教学 平台 的 应 用 []],《 外 语 电 化 教 
学 》(6):43-49. 

王 克 非 , 秦 洪 武 . 王 海 起 . (2007) ,双语 对 应 语料库 翻译 教学 平台 的 应 用 初探 []],《 外 语 电 
化 教学 )(6):3-8. 

王 克 非 \ 胡 显 耀 . (2008) ,基于 语料库 的 翻译 汉语 词汇 特征 研究 [J],《 中 国 翻 译 )(6),16- 
21. 

王 克 非 . 黄 立 波 . (2007) ,语料库 翻译 学 的 几 个 术语 [J],《 四 川 外 语 学 院 学 报 )(6) :101- 
105. 

王 克 非 . (1997) , 论 翻 译 研究 之 分 类 [],《 中 国 翻译 )(1) :12. 

王 克 非 . (2003) ,英汉 / 汉 英 语句 对 应 的 语 料 考察 []],《 外 语 教 学 与 研究 )(6). 

王 克 非 . (2004a) ,新 型 双语 语料库 的 设计 与 构建 《中 国 翻译 》(6) ;73-75. 

王 克 非 . (2004b) 《双语 对 应 语料库 :研制 与 应 用 )[C] ,北京 ;外语 教学 与 研究 出 版 社 , 

王 克 非 . (2004c) ,双语 平行 语料库 在 翻译 教学 上 的 用 途 [J],《 外 语 电 化 教学 )(6) : 27-32. 
王 克 非 . (2006) ,语料库 翻译 学 一 一 新 研究 范式 []],《 中 国外 语 》(3) :8-9. 

王 克 非 . (2007) ,双语 对 应 语料库 翻译 教学 平台 的 应 用 初探 []],《 外 语 电化 教学 》(6) :55- 
61. 

王 克 非 秦 洪 武 . (2009) , 英 译 汉语 言 特征 探讨 一 -基于 对 应 语料库 的 宏观 分 析 []],《 外 
FAY) :3-8. 

王 琼 琼 . 王 克 非 . (2004) ,一 项 翻译 实验 分 析 和 语料库 分 析 一 一 从 第 三 人 称 代词 照应 看 
翻译 敏感 的 培训 [站 , 载 王 克 非 等 ,双语 对 应 语料库 :研制 与 应 用 》[M], 北 京 :外 语 教 序 


[275] 
[2767 


[277] 
[278] 
[279] 
[280] 
[281] 
[282] 
[283] 
[284] 
[285] 


[286] 
[287] 
[288] 


[289] 
[290] 
[291] 
[292] 
[293] 
[294] 
[295] 
[296] 
[297] 
[298] 


[299] 


[300] 


参考 文献 // 247 


与 研究 出 版 社 ,223-231. 
ERK. (2000) 《语言 问题 探索 MJ? 广州 :中 山大 学 出 版 社 . 

5 REHM RANE. (2006) ,双语 平行 语料库 辅助 中 国 英语 学 习 者 翻译 实践 []],《 基 础 教育 外 
语 教学 研究 )(4) ;28-30. 

吴 昂 、 黄 立波 . (2006) ,关于 翻译 共性 的 研究 []],《 外 语 教学 与 研究 )(5) :296-302. 

吴 一 安 . (2005) ,优秀 外 语 教师 专业 素质 探究 [ 刀 , 人 外 语 教学 与 研究 )3):199-205 
ABE. (1990) 《现代 汉语 欧 化 语法 概论 )CLM] ,台北 :光明 图 书 公司 . 

AIK. (2001) ,汉语 语法 网 化 综述 [站 《语文 研究 )(1). 

能 学 亮 . (2007) 《语言 使 用 中 的 推理 LIM], 上海: 上 海外 语 教育 出 版 社 

IRELE. (2003) 《现代 汉语 篇 章 回 指 研究 并 M] ,北京 :中国 社会 科学 出 版 社 

徐 盛 桓 . (2007) ,基于 模型 的 语 用 推理 [站 《外 国语 》(3) :2-9. 

许 国 璋 . (1991) ,《 许 国 璋 论语 言 并 CJ] ,北京 :外 语 教学 与 研究 出 版 社 . 

许 家 金 . (2004) , 兰 开 斯 特 汉语 语料库 介绍 [OL], http: / fld. uste. edu, cn/123/xujiajin/ 
papers/. 

杨 惠 中 (主编 ). (2002),《 语 料 库 语言 学 导论 )LM], 上 海 : 上 海外 语 教育 出 版 社 

杨 惠 中 . (2004) ,编者 按 []],《 现 代 外 语 》(2). 

叶 常 青 . (2003) , 自 建 语料库 在 翻译 教学 中 的 应 用 一 红楼梦) 中 英文 本 用 于 翻译 教学 

的 课堂 设计 []],《 外 国语 言 文 学 )(3) :41-44. 

OY SME. FEM HOES. (2008) ,基于 Web 的 双语 平行 句 对 自动 获取 []],《 汉 语 信息 学 
报 》(5) :67-73. 
余光中 .(2002) ,余光中 谈 翻译 汇 MD] ,北京 :中 国 对 外 翻译 出 版 公司 . 

于 连 江 . (2004) ,基于 语料库 的 翻译 教学 研究 [JJ],《 外 语 电化 教学 )(6) :40-44. 
MENARIK. (2003),《 计 算 语 言 学 概论 并 M] ,北京 :商务 印 书馆. 

张 虹 . (2001) ,高 名 凯 、 昌 叔 湘 、 王 力 四 十 年 代 代词 理论 比较 [站 ,遵义 师范 学 院 学 报 》， 

(4) :58-61. 

FIKIR JKL. (2000) 《现代 汉语 虚词 LM], 上 海 :华东 师范 大 学 出 版 社 . 
张 培 基 等 . (1980) ,英汉 翻译 教程 LM], 上 海 :上 海外 语 教育 出 版 社 
赵 宏 、 邵 志 洪 . (2002) ,英汉 第 三 人 称 代词 语 篇 照应 功能 对 比 研究 [],《 外 语 教 学 与 研究 》 

(3):174-179. 

赵 世 开 . (1996), The contrastive study of English and Chinese personal pronouns; a 
preliminary pragmatic analysis( 英 汉人 称 代词 对 比 研究 )[C], 载 李瑞华 (主编 ), 人 (英汉 语 
言 文化 对 比 研究 汇 C], 上 海 : 上 海外 语 教育 出 版 社 ,185-199. 

赵 世 开 (主编 ).(1999) ,《 汉 英 对 比 语法 论 集 )[C], 上 海 :上 海 教育 出 版 社 . 

周 小 兵 .(1997) ,介词 的 语法 性 质 的 介词 研究 的 系统 方法 []],《 中 山大 学 学 报 》(3) :109- 
115. 

AAR. (1999) ,国内 百年 汉语 代词 研究 概述 [J],《 淮 北 煤 炭 师 院 学 报 》( 哲 社 版 ), (4): 
91-95. 


后 w 


我 开始 语料库 翻译 学 研究 不 觉 已 经 十 个 年 头 了 。 起 因 是 2000 年 申请 获得 教 
育 部 人 文 社 科 重 点 研究 基地 重大 项 目的 支持 ,创建 了 当时 最 大 的 通用 汉 英 平行 语 
料 库 , 并 开展 了 一 系列 初步 探讨 ,结集 为 (双语 对 应 语料库 :研制 与 应 用 》2004 年 
由 外 语 教学 与 研究 出 版 社 出 版 。 翌 年 ,国家 社 科 基金 批准 了 我 申请 的 “基于 大 型 英 
汉 对 应 语料库 的 翻译 研究 与 教学 平台 ”, 使 我 的 语料库 翻译 研究 得 以 延续 下 来 。 又 
由 于 我 的 一 些 学 生 和 朋友 陆续 进入 这 一 研究 领域 ,团队 不 断 扩大 , 产 出 不 少 让 人 感 
觉 新 颖 独到 的 成 果 , 于 是 ,基于 语料库 的 翻译 研究 在 我 国 逐 渐 形成 一 个 新 的 学 科 分 
支 一 -语料库 翻译 学 。 

这 本 书 , 特 别 是 概论 部 分 ,已 多 处 论 及 语料库 翻译 学 的 缘起 ,发 展 和 趋势 。 这 
虽然 只 是 一 个 不 到 20 年 的 年 轻 研究 领域 ,但 在 国际 上 和 国内 都 日 益 受到 重视 。 研 
究 论 文 论著 越 来 越 多 的 涌现 ,专题 学 术 研讨 会 每 年 不 止 一 次 的 召开 和 各 种 项 目 、 课 
题 的 申请 与 获 批 , 就 是 学 科 兴 盛 的 表现 。 

本 书 研究 的 问题 和 涉及 的 方面 ,也 是 语料库 翻译 学 发 展 的 一 个 缩影 。 从 研究 
内 容 上 讲 , 既 有 对 翻译 共性 假设 的 探究 和 检验 ,也 有 对 语料库 方法 论 的 探寻 和 反 
思 。 在 对 比 模式 上 ,我 们 已 不 限于 单纯 的 平行 或 类 比 , 还 有 多 类 文本 的 复合 对 比 ， 
如 平行 库 加 类 比 库 或 平行 库 加 单 语 库 的 翻译 语言 和 中 介 语 的 分 析 。 我 们 还 特别 注 
重 探讨 基于 英语 和 其 他 欧洲 语言 的 翻译 共性 研究 结果 是 否 适用 于 汉语 等 非 印 欧 语 
系 的 语言 。 从 方法 论 上 讲 , 既 注重 方法 论 的 解释 力 ,包括 如 何 选 择 研究 对 象 .如 何 
呈现 研究 发 现 以 及 如 何 解释 研究 结果 ,同时 ,也 认识 到 语料库 研究 是 一 个 不 断 检验 
和 完善 假设 的 过 程 , 它 是 在 实证 基础 上 的 描写 ,而 描写 最 终 还 是 为 了 更 合理 的 阐释 
翻译 现象 。 从 研究 视角 上 讲 , 主要 有 对 翻译 共性 问题 .翻译 语言 特征 、 翻 译文 体 特 
征 .语料库 教学 平台 以 及 专门 用 途 语 料 库 的 研制 与 应 用 等 课题 的 探索 ,是 一 个 多 元 
化 的 视角 , 切 人 点 除 形式 方面 的 词汇 表现 .搭配 组 合 外 ,还 延伸 到 句法 结构 、 话 语 特 
点 和 文体 风格 等 。 不 过 书 中 的 研究 基本 还 是 依据 文本 的 语料库 ,未 包括 口译 语 料 
库 。 研 究 也 有 待 深化 原 有 课题 ,解决 更 多 问题 。 

本 书 四 大 部 分 .23 章 , 分 别 概述 语料库 翻译 学 的 基本 理念 和 主要 内 容 、 探 析 包 
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括 平 行 语料库 和 类 比 语料库 基础 上 的 各 类 翻译 问题 研究 ,尝试 基于 语料库 的 翻译 
教学 和 实验 ,并 对 语料库 在 翻译 研究 与 教学 上 的 应 用 问题 作 一 些 探讨 。 全 书写 作 
历时 五 年 ,涉及 问题 庞杂 ,内 容 丰 富 而 有 一 定 争议 。 即 使 这 样 , 本 书 也 不 能 讨论 到 
语料库 翻译 学 的 所 有 内 容 , 前 后 分 析 的 视角 和 观点 也 可 能 不 尽 一 致 。 因 此 本 书 只 
是 在 语料库 翻译 学 方面 的 一 些 探索 。 这 是 一 个 新 兴 的 分 支 学 科 , 还 在 发 展 之 中 , 尚 
有 不 少 理论 ,途径 方法、 工具 等 方面 的 问题 需要 不 断 地 争论 和 开发 , 书 中 不 当 之 处 
还 望 读者 不 音 指正 ,大 家 共同 探讨 , 求 得 新 的 进步 。 

本 书 是 项 目 研究 成 果 , 首 先 应 该 感谢 全 国 哲 学 社会 科学 规划 办 的 支持 和 鼓励 。 
本 书 的 完成 ,我 要 特别 感谢 秦 洪 武 、 胡 显 兆 、 黄 立波 、 武 光 军 诸位 。 他 们 在 攻读 博士 
学 位 或 做 博士 后 研究 期 间 ,参与 了 这 个 项 目的 研究 ,分 担 了 不 少 研 究 课题 , 书 中 一 
些 章节 也 是 同 他 们 一 起 撰写 的 。 还 有 能 文 新 \ 李 德 超 . 王 金 狂 博 士 也 部 分 参与 了 项 
目 研究 并 共同 撰写 了 若干 章节 内 容 , 我 也 在 此 表示 谢意 。 这 是 一 个 研究 团队 的 集 
体 合作 成 果 , 否 则 是 不 可 能 完成 这 么 大 的 项 目 和 做 出 这 么 多 成 绩 来 的 。 最 后 我 要 
表达 对 北 外 以 文 秋芳 教授 为 主任 的 中 国外 语 教育 研究 中 心 这 个 非常 团结 合作 的 科 
研 集体 的 感谢 ! 良好 的 科研 环境 ,共同 的 学 术 上 进 , 教 促 了 我 们 的 研究 工作 ,消解 
了 直到 的 困难 和 烦恼 ,是 真正 意义 上 的 科研 保障 。 

两 年 前 的 一 次 学 术 会 议 上 ,上 海 交 通 大 学 出 版 社 的 领导 ,特别 是 同样 在 关注 语 
料 库 的 管 新 潮 老师 以 及 张国华 副 编审 ,敏锐 地 意识 到 这 一 新 兴 研 究 的 价值 ,参与 策 
划 和 筹备 了 “语料库 翻译 学 文库 ”。 他 们 为 这 套 从 书包 括 本 书 的 精心 编辑 和 顺利 出 
版 付出 了 许多 心血 , 令 我 感 佩 ,在 此 一 并 致谢 ! 


作 者 
2011 年 11 月 于 北 外 


